Nápověda využívá možnosti vyhledávače Lucene, který umožňuje indexování toků tokenů (toků slov). Analyzátory vytvářejí tokeny z toku znaků. Zkoumají obsah textu a poskytují tokeny pro použití s indexem. Textový tok lze tokenizovat mnoha jedinečnými způsoby. Triviální analyzátor může tokenizovat toky u každé mezery, jiný může provádět filtrování tokenů na základě potřeb dané aplikace. Protože dokumentaci tvoří většinou pro člověka čitelný text, požaduje se, aby analyzátory používané systémem nápovědy prováděly tokenizaci a normalizaci indexovaného textu s ohledem na daný jazyk a gramatiku. U některých jazyků se kvalita vyhledávání podstatně zvýší, pokud se nad indexovaným textem provede odebrání ukončovacích slov a rozbor.
Analyzátor přidaný k tomuto bodu rozšíření potlačí analyzátor poskytovaný pro dané národní prostředí systémem nápovědy Eclipse.
<!ELEMENT extension (analyzer*)>
<!ATTLIST extension
point CDATA #REQUIRED
id CDATA #IMPLIED
name CDATA #IMPLIED>
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale CDATA #REQUIRED
class CDATA #REQUIRED>
<extension id=
"com.xyx.XYZ"
point=
"org.eclipse.help.base.luceneAnalyzer"
>
<analyzer locale=
"ll_CC"
class=
"com.xyz.ll_CCAnalyzer"
/>
</extension>
Hodnota atributu class musí představovat třídu, která rozšiřuje org.apache.lucene.analysis.Analyzer. Doporučuje se, aby tento analyzátor prováděl filtrování malých písmen pro jazyky, kde je možné zvýšit počet nalezených výskytů, jestliže se provádí vyhledávání s rozlišením malých a velkých písmen.
Copyright (c) 2000, 2003 IBM Corporation a další.
Všechna práva vyhrazena.
Tento program a doprovodné materiály jsou zpřístupněny za podmínek licence Eclipse Public License
v1.0, která je součástí této distribuce a je k dispozici na adrese
http://www.eclipse.org/legal/epl-v10.html