Analizador Lucene

org.eclipse.help.base.luceneAnalyzer

3.0 (originariamente añadido en el release 2.0 como org.eclipse.help.luceneAnalyzer)

Este punto de extensión permite registrar analizadores de texto para que los utilice el sistema de ayuda al indexar la documentación y hacer búsquedas en ella.

La ayuda explota las posibilidades del motor de búsqueda Lucene, que permite la indexación de corrientes de símbolos (corrientes de palabras). Los analizadores crean símbolos a partir de la corriente de caracteres. Examinan el contenido del texto y suministran símbolos para utilizarlos con el índice. Existen numerosas maneras exclusivas de convertir en símbolos la corriente de texto. En función de las necesidades de la aplicación, un analizador trivial puede, por ejemplo, simbolizar las corrientes en espacios en blanco, mientras que otro puede realizar el filtro de símbolos. Dado que la documentación consiste principalmente en texto legible por personas, es aconsejable que los analizadores utilizados por el sistema de ayuda realicen una simbolización que detecte el idioma y la gramática y la normalización del texto indexado. En algunos idiomas, la calidad de la búsqueda mejora significativamente si se realizan la eliminación de palabras de relleno y la indicación de temas relacionados en el texto indexado.

El analizador suministrado a este punto de extensión alterará temporalmente el que suministra el sistema de ayuda de Eclipse para un entorno local determinado.

<!ELEMENT extension (analyzer*)>

<!ATTLIST extension

point CDATA #REQUIRED

id    CDATA #IMPLIED

name  CDATA #IMPLIED>


<!ELEMENT analyzer EMPTY>

<!ATTLIST analyzer

locale CDATA #REQUIRED

class  CDATA #REQUIRED>


A continuación figura un ejemplo de configuración de analizador Lucene:

 

<extension id=

"com.xyx.XYZ"

point=

"org.eclipse.help.base.luceneAnalyzer"

>

<analyzer locale=

"ll_CC"

class=

"com.xyz.ll_CCAnalyzer"

/>

</extension>

El valor del atributo locale debe representar una serie de entorno local de cinco o de dos caracteres. Si el analizador se ha configurado para un idioma especificando la designación de idioma de dos letras, el analizador se utilizará para todos los entornos locales de ese idioma. Si el analizador se ha configurado para que coincida con un entorno local de cinco caracteres, este es el que se utilizará, en vez del otro.

El valor del atributo class debe representar una clase que amplíe org.apache.lucene.analysis.Analyzer. Es aconsejable que este analizador realice el filtrado de minúsculas para aquellos idiomas en los que es posible aumentar el número de aciertos de búsqueda haciendo que la búsqueda detecte las mayúsculas/minúsculas.

El sistema de ayuda de Eclipse proporciona analizadores para todos los idiomas. Para los idiomas inglés y alemán, los analizadores realizan el filtrado de palabras de relleno, el filtrado de minúsculas y la indicación de temas relacionados. Para todos los demás idiomas, el analizador suministrado sólo realiza el filtrado de minúsculas.