Lucene Analyzer

org.eclipse.help.base.luceneAnalyzer

3.0 (aggiunto nella versione 2.0 come org.eclipse.help.luceneAnalyzer)

Questo punto di estensione è utilizzato per registrare gli analizzatori di testo utilizzati dalla guida per indicizzare e ricercare la documentazione.

La guida sfrutta la funzionalità del motore di ricerca Lucene, che consente di indicizzare flussi di token (flussi di parole). Gli analizzatori creano token dal flusso di caratteri. Esaminano il contenuto del testo e forniscono token da utilizzare con l'indice. I token possono essere creati dal flusso di testo in molti modi univoci. Un analizzatore elementare può creare token dai flussi in presenza di uno spazio, un altro può eseguire il filtro dei token in base alle esigenze dell'applicazione. Poiché la maggioranza della documentazione è costituita di testo leggibile, gli analizzatori utilizzati dal sistema della guida devono creare token che riconoscono la lingua e la grammatica ed eseguire la normalizzazione del testo indicizzato. In alcune lingue la qualità della ricerca aumenta in maniera considerevole se sul testo indicizzato viene eseguita l'analisi dell'origine e la rimozione delle parole non significative.

L'analizzatore fornito in questo punto di estensione sostituirà quello fornito dal sistema della guida Eclipse per una determinata locale.

<!ELEMENT extension (analyzer*)>

<!ATTLIST extension

point CDATA #REQUIRED

id    CDATA #IMPLIED

name  CDATA #IMPLIED>


<!ELEMENT analyzer EMPTY>

<!ATTLIST analyzer

locale CDATA #REQUIRED

class  CDATA #REQUIRED>


Di seguito è riportato un esempio di configurazione dell'analizzatore Lucene:

 

<extension id=

"com.xyx.XYZ"

point=

"org.eclipse.help.base.luceneAnalyzer"

>

<analyzer locale=

"ll_CC"

class=

"com.xyz.ll_CCAnalyzer"

/>

</extension>

Il valore dell'attributo locale deve essere una stringa di 5 o 2 caratteri. Se un analizzatore viene configurato per una lingua mediante una designazione linguistica di due lettere, l'analizzatore verrà utilizzato per tutte le impostazioni locali di questa lingua. Se l'analizzatore è configurato per un'impostazione internazionale di cinque caratteri, sarà utilizzato alternativamente.

Il valore dell'attributo class deve rappresentare una classe che rappresenta un'estensione di org.apache.lucene.analysis.Analyzer. Per le lingue in cui è possibile aumentare il numero delle corrispondenze scegliendo come opzione di ricerca la distinzione tra maiuscolo/minuscolo, si consiglia di impostare il filtro in caratteri minuscoli.

Il sistema della guida Eclipse fornisce analizzatori per tutte le lingue. Gli analizzatori di inglese e tedesco eseguono il filtro di parole non significative, il filtro di caratteri minuscoli e l'analisi dell'origine. Per tutte le altre lingue, gli analizzatori forniti eseguono solo il filtro dei caratteri minuscoli.