IBM I: OmniFind Text Search Server For DB2 For I

Transcription

IBM iVersión 7.2Negocio electrónico y servicio WebOmniFind Text Search Server for DB2for i

IBM iVersión 7.2Negocio electrónico y servicio WebOmniFind Text Search Server for DB2for i

AvisoAntes de utilizar esta información y el producto al que hace referencia, lea la información del apartado “Avisos” en lapágina 157.Este documento puede contener referencias al código interno bajo licencia. El código interno bajo licencia es códigode máquina cuya licencia se obtiene bajo los términos del Acuerdo de licencia de IBM para código de máquina. Copyright IBM Corporation 2002, 2014.

ContenidoOmniFind Text Search Server for DB2for i . . . . . . . . . . . . . . . . 1Novedades de IBM i 7.2 . . . . . . . . . . 1Archivo PDF para OmniFind Text Search Server forDB2 for i . . . . . . . . . . . . . . . 1Introducción a OmniFind Text Search Server for DB2for i . . . . . . . . . . . . . . . . . 2Visión general de OmniFind Text Search Server forDB2 for i . . . . . . . . . . . . . . 2Requisitos del sistema para la instalación deOmniFind Text Search Server for DB2 for i . . . 4Conceptos clave . . . . . . . . . . . . . 4Crear y actualizar un índice de búsqueda de texto 4Indexación asíncrona y desencadenantes . . . . 5Formatos de documento soportados . . . . . 6Tipos de datos soportados . . . . . . . . . 7Puntuación de texto y soporte de sinónimos . . . 7Proceso lingüístico . . . . . . . . . . . 8Idiomas soportados . . . . . . . . . . 8Proceso lingüístico de documentos en chino,japonés y coreano. . . . . . . . . . . 9Nombre de alias de servidor. . . . . . . . 11Instalar y configurar funciones de búsqueda detexto. . . . . . . . . . . . . . . . . 12Instalar OmniFind Text Search Server for DB2 fori . . . . . . . . . . . . . . . . . 12Iniciar funciones de búsqueda de texto . . . . 13Crear un índice de búsqueda de texto . . . . 14Actualizar un índice de búsqueda de texto . . . 14Buscar en un índice de búsqueda de texto . . . 14Recorte de documentos . . . . . . . . . 15Procedimientos almacenados de administración parabúsqueda de texto . . . . . . . . . . . . 15SYSPROC.SYSTS START . . . . . . . . . 15SYSPROC.SYSTS STOP . . . . . . . . . 17SYSPROC.SYSTS CREATE . . . . . . . . 19SYSPROC.SYSTS ALTER . . . . . . . . . 28SYSPROC.SYSTS DROP . . . . . . . . . 34SYSPROC.SYSTS UPDATE . . . . . . . . 36SYSPROC.SYSTS SHUTDOWN. . . . . . . 39Buscar con un índice de búsqueda de texto . . . . 40CONTAINS . . . . . . . . . . . . . 40SCORE . . . . . . . . . . . . . . . 43Sintaxis de argumentos de búsqueda . . . . . 45Ejemplos de consulta simple. . . . . . . 47Operadores de búsqueda avanzada . . . . 48Búsqueda de caracteres especiales . . . . . 50Ejemplo de utilización de las funcionesCONTAINS y SCORE . . . . . . . . . 53Búsqueda XML . . . . . . . . . . . . 53Soporte de espacio de nombres en búsquedasXML. . . . . . . . . . . . . . . 59Utilizar espacios de nombres en una búsqueda 61Ejemplo de búsqueda XML . . . . . . . 65Gramática de consultas de búsqueda XML . . 68 Copyright IBM Corp. 2002, 2014Administrar un OmniFind(r) Text Search Server forDB2(r) for i . . . . . . . . . . . . . . 69Iniciar OmniFind Text Search Server for DB2 for i 70Detener OmniFind Text Search Server for DB2 fori . . . . . . . . . . . . . . . . . 70Salvar y restaurar índices de búsqueda de texto71Salvar y restaurar un índice de búsqueda detexto sin datos . . . . . . . . . . . 71Salvar y restaurar un índice de búsqueda detexto con datos . . . . . . . . . . . 73Determinación de problemas . . . . . . . 74Visualizar y guardar registros del servidor . . . 75Herramientas de administración . . . . . . 76Herramienta de configuración . . . . . . 76SYSPROC.SYSTS REMOVE . . . . . . . 78SYSPROC.SYSTS REPRIMEINDEX . . . . 80SYSTS CLEAR INDEXES . . . . . . . 81SYSPROC.SYSTS VALIDITYCHECK . . . . 82QDBTSLIB.QDBTS ROWS STATUS . . . . 83Diccionarios de sinónimos . . . . . . . 85Añadir un diccionario de sinónimos a unacolección . . . . . . . . . . . . 85Eliminar un diccionario de sinónimos deuna colección . . . . . . . . . . . 86Buscar índices huérfanos y ausentes . . . . 87Administración avanzada. . . . . . . . 88Herramienta ServerInstance . . . . . . . . 90Health Checker . . . . . . . . . . . . 91Consideraciones relativas a las ASPindependientes para OmniFind Text SearchServer for DB2 for i. . . . . . . . . . . 92Alta disponibilidad . . . . . . . . . . . 93Análisis del rendimiento . . . . . . . . . 94Consideraciones relativas a las transacciones . . 98Utilización de IBM Navigator for i. . . . . . 99Trabajar con servidores de búsqueda de texto 99Trabajar con índices de búsqueda de texto101Visualizar construcciones de índice debúsqueda de texto . . . . . . . . . 103Utilizar System i Navigator. . . . . . . . 104Trabajar con servidores de búsqueda de texto 105Trabajar con índices de búsqueda de texto107Visualizar construcciones de índice debúsqueda de texto . . . . . . . . . 110Tablas de administración de búsqueda de texto . . 111Tabla de administraciónQSYS2.SYSTEXTDEFAULTS . . . . . . . 111Tabla de administraciónQSYS2.SYSTEXTINDEXES . . . . . . . . 112Tabla de administraciónQSYS2.SYSTEXTCOLUMNS . . . . . . . 114Tabla de administraciónQSYS2.SYSTEXTSERVERS . . . . . . . . 115Tabla de administraciónQSYS2.SYSTEXTCONFIGURATION . . . . . 116iii

Tabla de administraciónQSYS2.SYSTEXTSERVERHISTORY . . . . .Vista Índice de búsqueda de texto . . . . .Ampliaciones para indexar y buscar datos no DB2Visión general de las ampliaciones . . . . .Crear una colección de búsqueda de texto . . .Añadir un conjunto de objetos de datos dearchivo spool . . . . . . . . . . . .Eliminar un conjunto de objetos de datos dearchivo spool . . . . . . . . . . . .Añadir un conjunto de objetos de datos dearchivo continuo . . . . . . . . . . .Eliminar un conjunto de objetos de datos dearchivo continuo . . . . . . . . . . .Añadir un conjunto de objetos de archivo físicode origen multimiembro. . . . . . . . .Eliminar un conjunto de objetos de archivofísico de origen multimiembro. . . . . . .Eliminar un conjunto de objetos . . . . . .Actualizar la colección . . . . . . . . .Volver a llenar la colección de búsqueda detexto . . . . . . . . . . . . . . .ivIBM i: OmniFind Text Search Server for DB2 for i133Buscar en la colección . . . . . . . .Consultar información de conjunto de objetosRecuperar estado de objetos de índices . . .Obtener objetos no indexados . . . . . .Recuperar estado de colección . . . . . .Eliminar una colección de búsqueda de textoModificar una colección de búsqueda de textoConsideraciones sobre las ASP independientespara las colecciones de búsqueda de texto . .Consideraciones sobre la copia de seguridad yrestauración de colecciones de búsqueda detexto . . . . . . . . . . . . . .Mensajes y códigos . . . . . . . . . .Mensajes de OmniFind . . . . . . . .135Avisos . . . . . . . . . . . . . . n de la interfaz de programación .Marcas registradas. . . . . . . . . . 141143. 144. 145. 146148149. 152. 152. 153. 153. 159. 159Índice. . . . . . . . . . . . . . . 161

OmniFind Text Search Server for DB2 for iOmniFind Text Search Server for DB2 for i permite emitir sentencias SQL que satisfagan las consultas debúsqueda de texto habituales en documentos almacenados en una base de datos DB2.Nota: Al utilizar los ejemplos de código, acepta los términos del apartado “Información sobre licencia decódigo y exención de responsabilidad” en la página 156.Novedades de IBM i 7.2Información relativa a las novedades o cambios significativos realizados en el temario de OmniFind TextSearch Server for DB2 for i.Las principales características nuevas son las siguientes:v “Ampliaciones para indexar y buscar datos no DB2” en la página 118– “Añadir un conjunto de objetos de archivo físico de origen multimiembro” en la página 135– “Añadir un conjunto de objetos de datos de archivo continuo” en la página 131– “Modificar una colección de búsqueda de texto” en la página 149– Eliminar conjunto de objetos por atributo- “Eliminar un conjunto de objetos de datos de archivo spool” en la página 128- “Eliminar un conjunto de objetos de datos de archivo continuo” en la página 133- “Eliminar un conjunto de objetos de archivo físico de origen multimiembro” en la página 137v “Búsqueda de caracteres especiales” en la página 50v Eliminar índices huérfanosv Concluir servidorv Comprobar el estado y el código de retorno para cada fila en estado de aviso o de errorv Soporte de RCAC– Crear índice de búsqueda de texto protegido– Modificar índice de búsqueda de texto a índice protegidoCómo visualizar las novedades o cambiosPara facilitar la visualización de los cambios técnicos, el Information Center utiliza:v La imagen depara marcar el inicio de información nueva o modificada.para marcar el final de la información nueva o modificada.v La imagen deEn los archivos PDF, puede que observe barras de revisión ( ) en el margen izquierdo de la informaciónnueva o modificada.Para buscar otra información relativa a las novedades o cambios de este release, consulte elMemorándum para los usuarios.Archivo PDF para OmniFind Text Search Server for DB2 for iUtilice esta página para visualizar e imprimir un PDF de esta información.Para visualizar o descargar el archivo PDF de este documento, seleccione OmniFind Text Search Serverfor DB2 for i (aproximadamente 1192 KB). Copyright IBM Corp. 2002, 20141

Otra informaciónTambién puede visualizar o imprimir cualquiera de estos archivos PDF:v Preparing for and Tuning the SQL Query Engine on DB2 for i5/OSv SQL Performance Diagnosis on IBM DB2 Universal Database for iSeries.Guardar archivos PDFPara guardar un PDF en la estación de trabajo a fin de visualizarlo o imprimirlo:1. Pulse con el botón derecho del ratón el PDF en el navegador (pulse con el botón derecho del ratón elenlace precedente).2. Pulse la opción que guarda el PDF localmente.3. Vaya al directorio en el que desee guardar el PDF.4. Pulse Guardar.Descargar Adobe ReaderEs necesario tener instalado Adobe Reader en el sistema para visualizar o imprimir estos archivos PDF.Puede descargar una copia gratuita desde Adobe (http://get.adobe.com/reader/).Introducción a OmniFind Text Search Server for DB2 for iDB2 for i utiliza OmniFind(r) Text Search Server como motor de indexación y búsqueda de losdocumentos almacenados en una base de datos DB2.OMNIFIND es un producto de búsqueda de texto que permite a los usuarios de IBM i realizar búsquedasen texto no estructurado almacenado en una columna de una tabla de DB2 for i. El texto almacenado enla columna puede ser texto simple de tipo carácter, un documento XML o alguno de los diversos tipos dedocumentos de texto enriquecido, como por ejemplo un archivo PDF o DOC. El producto permite a losusuarios indexar datos no estructurados sin necesidad de analizarlos en un formato estructurado, comopor ejemplo una tabla SQL.OmniFind Text Search Server es un motor de búsqueda según contexto. Da soporte a la prestación debúsquedas aproximadas. Por ejemplo, la búsqueda de 'mice' (ratón, en inglés) descubrirá los documentosque contienen 'mice' (ratones, en inglés) o 'mouse'. El motor de búsqueda también da soporte al contextoidiomático. Por ejemplo, comprende los equivalentes de búsqueda aproximada de 'mice' y 'mouse' tantoen inglés como en español.Muchas aplicaciones pueden aprovechar esta prestación. Un buen ejemplo de ello es una base de datosde Recursos humanos. Los currículos de los candidatos pueden almacenarse en la base de datos encualquier formato que permita someterlos. Pueden utilizarse búsquedas subsiguientes medianteOmniFind para buscar candidatos potenciales con determinadas habilidades clave.Visión general de OmniFind Text Search Server for DB2 for iOmniFind Text Search Server for DB2 for i suministra un conjunto de procedimientos almacenadosadministrativos y dos funciones incorporadas: CONTAINS y SCORE. Estas funciones se utilizan pararealizar búsquedas en los índices de texto creados a partir de los documentos almacenados en una tablade DB2. Los procedimientos almacenados administrativos se utilizan para habilitar e inhabilitar labúsqueda de texto y para crear, actualizar y eliminar índices de texto.2IBM i: OmniFind Text Search Server for DB2 for i

Un índice de texto puede crearse a partir de cualquier columna de los tipos de datos siguientes:v CHARv VARCHARv CLOBv LLos datos pueden contener texto sin formato, HTML, XML o diversos tipos de documentos enriquecidos,como por ejemplo archivos PDF. Los datos se leen de la columna de texto y se convierten a Unicode(CCSID 1208) antes de indexarlos.Los índices de texto no son índices DB2 típicos. No se mantienen automáticamente, no pueden registrarsepor diario ni puede realizarse una copia de seguridad de los mismos mediante los métodos típicos decopia de seguridad y restauración. Los índices de texto se crean y almacenan en un servidor de búsquedade texto.Por omisión, el servidor de búsqueda de texto se crea en el mismo sistema que los datos almacenados enla base de datos DB2. Sin embargo, un servidor de búsqueda de texto puede crearse en otro servidor queejecute IBM i, Linux, UNIX, AIX o Windows.El servidor de búsqueda de texto contiene una colección de términos significativos extraídos de cada filade la columna. Para la comunicación con el servidor de búsqueda de texto, se utiliza una conexiónTCP/IP.CONTAINS y SCORE son funciones incorporadas integradas en DB2 for i.DB2 for i utiliza OmniFind(r) Text Search Server como motor de indexación y búsqueda de losdocumentos almacenados en una base de datos DB2.OMNIFIND admite varias colecciones. Una colección contiene un índice de búsqueda de texto y lasopciones específicas del índice para analizar, indexar y buscar.OMNIFIND tiene una interfaz gráfica de usuario para la administración de servidores e índices de texto.El servidor de búsqueda de texto también suministra procedimientos almacenados SQL y herramientas delínea de mandatos que pueden utilizarse para tareas habituales. Estas tareas habituales incluyen laconfiguración y administración del servidor de búsqueda de texto, la creación de un diccionario desinónimos para una colección y el diagnóstico de problemas.Conceptos relacionados:“Procedimientos almacenados de administración para búsqueda de texto” en la página 15Puede iniciar y detener funciones de búsqueda de texto y crear, eliminar y actualizar índices de búsquedade texto mediante un conjunto de procedimientos almacenados SQL de administración. Estosprocedimientos pueden invocarse desde cualquier interfaz de SQL. No puede llamar a estosprocedimientos desde una línea de mandatos de IBM i mediante mandatos CL.Referencia relacionada:“CONTAINS” en la página 40Puede utilizar la función CONTAINS para realizar búsquedas en un índice de búsqueda de textoutilizando criterios especificados en un argumento de búsqueda. La función devuelve un resultado queOmniFind Text Search Server3

indica si se ha encontrado una coincidencia.“SCORE” en la página 43Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizandocriterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevanciaque mide hasta que punto un documento coincide con la consulta.Requisitos del sistema para la instalación de OmniFind Text SearchServer for DB2 for iAntes de instalar OmniFind Text Search Server for DB2 for i, asegúrese de que el sistema cumple todoslos requisitos de hardware, software y sistema operativo.Al instalar OmniFind Text Search Server for DB2 for i, el programa de instalación crea un servidor debúsqueda de texto para IBM i. Puede instalar servidores de búsqueda de texto en servidores remotos queejecuten Linux o Windows. Estos servidores forman parte de DB2 Accessories Suite for z/OS imstools/db2tools/accessories-suite/)contiene información relativa a la descarga de la suite. El enlaceRequisitos de softwareAsegúrese de que el sistema cumple los siguientes requisitos mínimos de software:v 5770JV1 IBM Developer Kit for Java – Uno de los siguientes:- 5770JV1 Opción 11 Java SE 6 32 bits- 5770JV1 Opción 12 Java SE 6 64 bitsv DB2 Universal Java Driver instalado y configurado en el servidor de búsqueda de textov Para IBM i, deben estar instalados los programas siguientes:– 5770SS1 Opción 30 Qshell– 5770SS1 Opción 33 IBM i Portable Application Solutions Environment (IBM i PASE)– 5770SS1 Opción 39 International Components for Unicode– Haber aplicado al sistema el PTF de grupo más reciente para IBM DB2 for i.Conceptos claveLa comprensión de los conceptos clave acerca de las funciones de búsqueda de texto le ayudará aaprovechar las ventajas de OmniFind Text Search for DB2 for i. Los conceptos clave son los tipos dedocumentos y los idiomas soportados.Crear y actualizar un índice de búsqueda de textoPuede crear un índice de búsqueda de texto definiendo y declarando las propiedades del mismo. Puedeactualizar un índice de búsqueda de texto añadiendo al mismo datos nuevos de una tabla de DB2.También puede actualizar un índice de búsqueda de texto cambiando los datos existentes en el mismo.Para cada índice de búsqueda de texto que cree, se creará una colección en OmniFind Text Search Serverfor DB2 for i. Tras la creación inicial, el índice de búsqueda de texto no contiene datos.Los datos se añaden al índice de búsqueda de texto llamando al procedimiento almacenadoSYSPROC.SYSTS UPDATE. El primer proceso de actualización añade todos los documentos de texto dela columna de texto al índice de búsqueda de texto. Este proceso se conoce como actualización inicial. Lasactualizaciones subsiguientes son incrementales.Cuando se crea un índice de búsqueda de texto, se crean o actualizan los objetos siguientes:4IBM i: OmniFind Text Search Server for DB2 for i

v La tabla intermedia se crea en la biblioteca QSYS2.v Los desencadenantes INSERT, DELETE y UPDATE se añaden a la tabla base.v Se crea una vista SQL con el nombre del índice de búsqueda de texto en el esquema del índice debúsqueda de texto. Esta vista contiene información acerca del índice de texto. Por ejemplo, la vistapuede utilizarse para obtener el nombre de la tabla base y el nombre de la tabla intermedia. La vistatambién muestra el número de cambios pendientes realizados en la tabla base que aún no se hanreflejado en el índice de búsqueda de texto.v Los catálogos de índice de búsqueda de texto (SYSTEXTINDEXES y SYSTEXTCOLUMNS) de labiblioteca QSYS2 se actualizan añadiendo una entrada para el nuevo índice de búsqueda de texto.Consideraciones relativas a la tabla intermedia:v No realice ninguna operación de base de datos en la tabla intermedia, excepto salvar y restaurar elarchivo o cambiar autorizaciones.v Si está cambiando las autorizaciones sobre la tabla base, cambie también las autorizaciones sobre latabla intermedia.Consideraciones relativas a la tabla base:v No elimine los desencadenantes DELETE, UPDATE e INSERT que se han añadido al crear un índice debúsqueda de texto.v Al eliminar el índice de búsqueda de texto, se eliminan los desencadenantes.v No modifique ni elimine el valor de ROWID, clave primaria o columna exclusiva utilizado como claveen el índice de búsqueda de texto.v La modificación de los datos de columna de la tabla base que provocan truncamiento de datos puedendar como resultado falsas coincidencias positivas en el índice de búsqueda de texto.Referencia relacionada:“SYSPROC.SYSTS UPDATE” en la página 36Puede llamar al procedimiento almacenado SYSPROC.SYSTS UPDATE para actualizar el índice debúsqueda de texto a fin de reflejar el contenido actual de la columna de texto.“Tabla de administración QSYS2.SYSTEXTINDEXES” en la página 112Puede visualizar información acerca de cada índice de búsqueda de texto en la tabla de administraciónQSYS2.SYSTEXTINDEXES. Cada índice de búsqueda de texto tiene un nombre, un nombre de esquema yun nombre de colección asociada en el servidor de búsqueda de texto.“Tabla de administración QSYS2.SYSTEXTCOLUMNS” en la página 114Puede visualizar información acerca de las columnas de texto de un índice de búsqueda de texto en latabla de administración QSYS2.SYSTEXTCOLUMNS. Cada índice de búsqueda de texto tiene un ID deíndice, nombres de columna de texto y el nombre de esquema de la tabla base.Indexación asíncrona y desencadenantesPuede actualizar el índice de búsqueda de texto en OmniFind Text Search Server for DB2 for imanualmente o planificarlo para que se ejecute automáticamente.El índice de búsqueda de texto que se conserva en OmniFind Text Search Server for DB2 for i no seactualiza síncronamente cuando se actualiza la tabla de DB2. La actualización de un índice de búsquedade texto es una operación extensa.En lugar de ello, existen desencadenantes que capturan los cambios realizados en la columna de la tablade DB2 en una tabla de registro local. Esta tabla de registro también se denomina tabla intermedia. Estosdesencadenantes almacenan automáticamente la información relativa a los documentos nuevos,cambiados y suprimidos en una tabla de registro. Cada tabla de registro está asociada a un índice debúsqueda de texto. La aplicación del contenido de la tabla de registro a su índice de búsqueda de textocorrespondiente se denomina actualización incremental.OmniFind Text Search Server5

Debe actualizar periódicamente el índice de búsqueda de texto para que los cambios se reflejen en lasconsultas.Puede actualizar el índice de búsqueda de texto manualmente llamando al procedimiento almacenadoSYSPROC.SYSTS UPDATE.Las actualizaciones también pueden planificarse para que se produzcan automáticamente especificando lacláusula UPDATE FREQUENCY en el procedimiento SYSPROC.SYSTS CREATE al crear el índice detexto.Referencia relacionada:“SYSPROC.SYSTS CREATE” en la página 19Puede llamar al procedimiento almacenado SYSPROC.SYSTS CREATE para crear un índice de búsquedade texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsquedade texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contenganlas funciones CONTAINS o SCORE.“SYSPROC.SYSTS UPDATE” en la página 36Puede llamar al procedimiento almacenado SYSPROC.SYSTS UPDATE para actualizar el índice debúsqueda de texto a fin de reflejar el contenido actual de la columna de texto.Formatos de documento soportadosLos datos de una columna de texto pueden ser texto sin formato, un documento HTML, un XML ocualquier documento que el motor de búsqueda reconozca.OmniFind Text Search Server for DB2 for i analiza los documentos para extraer las partes relevantes yhacer disponibles para las búsquedas. Por ejemplo, los códigos y metadatos de un documento HTML nose indexan.Está soportado el análisis de los formatos de documento siguientes:v TEXT: texto sin formatov HTML: lenguaje de marcado de hipertextov XML: lenguaje de códigos ampliablev INSO: OmniFind Text Search Server for DB2 for i utiliza filtros para detectar el formato de losdocumentos de texto. Están soportados los siguientes formatos de documento INSO:– XML– HTML– JustSystems Ichitaro– Lotus 123– Lotus Freelance– Lotus WordPro– Microsoft Excel– Microsoft PowerPoint– Microsoft Rich Text Format– Microsoft Visio– Microsoft Word– Microsoft Write– Portable Document Format (PDF)– Quattro Pro– Rich Text RTF– StarOffice Calc y OpenOffice Calc6IBM i: OmniFind Text Search Server for DB2 for i

Todos los documentos de una columna de texto indexado deben tener el mismo formato (TEXT, HTML,XML o INSO).Datos XMLLa estructura XML de los datos XML se indexa en OmniFind Text Search Server for DB2 for i después deanalizar los datos por medio de un analizador XML. A continuación, puede utilizar la sintaxis de consultade búsquedas XML soportada para recuperar los resultados.Conceptos relacionados:“Búsqueda XML” en la página 53Puede indexar y realizar búsquedas en documentos XML. La gramática de búsqueda XML utiliza unsubconjunto del lenguaje W3 XPath con ampliaciones para búsqueda de texto. Las ampliaciones dansoporte a búsquedas de rango de valores numéricos, de fecha (Date) y fecha y hora (DateTime) asociadoscon un atributo o elemento XML. Los elementos estructurales pueden utilizarse por separado ocombinarse con texto sin formato en las consultas.Tipos de datos soportadosLos datos de las columnas de texto que desea indexar y en las que realizar búsquedas pueden ser datosbinarios o datos de tipo carácter.Los tipos de datos siguientes son datos binarios:v BINARYv VARBINARYv BLOBAdemás, OMNIFIND maneja los tipos de datos siguientes de forma similar a los datos binarios:v CHAR FOR BIT DATAv VARCHAR FOR BIT DATALos tipos de datos siguientes son datos de tipo carácter:v CHAR FOR SBCS DATA o FOR MIXED DATAv VARCHAR FOR SBCS DATA o FOR MIXED DATAv CLOBv DBCLOBv GRAPHICv VARGRAPHICv XMLSi los datos son binarios, puede especificar el CCSID (identificador de juego de caracteres codificados)utilizado para crear el índice de búsqueda de texto. Para datos de tipo carácter, la base de datos DB2conoce la codificación; por tanto, si especifica explícitamente un CCSID, dicha especificación se ignora.Puntuación de texto y soporte de sinónimosPuede utilizar sinónimos para mejorar los resultados de una consulta. Puede utilizar una puntuación detexto para averiguar el grado de exactitud con el que un resultado coincide con la consulta.Puntuación de textoUna puntuación de texto se calcula como parte de la búsqueda y puede incluirse en los resultados de laconsulta. Una puntuación de texto es un valor de 0 a 1, de hasta tres dígitos decimales; por ejemplo,OmniFind Text Search Server7

0,000 a 1,000. Una puntuación de texto indica el grado de exactitud con el que un resultado coincide conla consulta en relación a todos los demás documentos del índice de búsqueda de texto.OMNIFIND compone la puntuación de texto a partir de diversos factores, tales como la importanciagenérica de los términos de búsqueda y la proximidad de apariciones de los términos de búsqueda. Laimportancia general se basa en la frecuencia de los términos de cada documento y en el desplazamientode la frecuencia de los términos en todos los documentos.Soporte de sinónimosOmniFind Text Search Server for DB2 for i admite la utilización de sinónimos para modificar losresultados de una consulta. La utilización de sinónimos puede aumentar el número de resultados deconsulta haciendo que más documentos coincidan con una consulta. Sin embargo, el uso de sinónimostambién puede disminuir la precisión de una consulta y dificultar la búsqueda de un número menor dedocumentos que coincidan con los criterios de búsqueda exactos.Por omisión, no se utilizan sinónimos para una consulta. Para utilizar sinónimos en una consulta, cree undiccionario de sinónimos y añádalo a una colección mediante la herramienta de sinónimos.Para obtener más información acerca de los sinónimos, consulte el apartado “Diccionarios de sinónimos”en la página 85.Referencia relacionada:“SCORE” en la página 43Puede utilizar la función SCORE para realizar búsquedas en un índice de búsqueda de texto utilizandocriterios especificados en un argumento de búsqueda. La función devuelve una puntuación de relevanciaque mide hasta que punto un documento coincide con la consulta.Proceso lingüísticoOmniFind Text Search Server for DB2 for i suministra paquetes de diccionarios para dar soporte alproceso lingüístico de documentos y consultas que no están en inglés.Como alternativa a la segmentación de palabras basada en diccionarios, OmniFind Text Search Server forDB2 for i utiliza soporte de segmentación n-gram para idiomas tales como el chino, el japonés y el coreano.La segmentación n-gram es un método de análisis que considera las secuencias solapadas de un número decaracteres determinado como una sola palabra. Como alternativa, la segmentación de espacio en blancobasada en Unicode utiliza un espacio en blanco para delimitar las palabras.Si un documento de texto se encuentra en uno de los idiomas soportados, el proceso lingüístico se lleva acabo cuando el texto se analiza para generar señales. Para los idiomas no soportados, se devuelve uncódigo de error.Al realizar una búsqueda en un índice de búsqueda de texto, se indica una coincidencia que contienevariantes lingüísticas de los términos de consulta. Las variantes de una palabra dependen del idioma dela consulta.Idiomas soportadosPuede especificar que los documentos de texto se procesen mediante un idioma específico.Puede especificar el idioma de los datos de texto indexados en el procedimiento almacenado deadministración SYSPROC.SYSTS CREATE. Si establece el valor en AUTO, OmniFind Text Search Serverfor DB2 for i intentará determinar el idioma. Para documentos breves, la detección automática puede noser exacta y no es recomendable. El idioma predeterminado para el proceso lingüístico es el inglés(en US).8IBM i: OmniFind Text Search Server for DB2 for i

La tabla siguiente muestra los códigos de idioma de cinco caracteres correspondientes a los idiomassoportados.Tabla 1. Códigos de idioma de cinco caracteres correspondientes a los idiomas soportadosCódigo de idiomaIdiomaar AAÁrabecs CZChecoda DKDanésde CHAlemán (Suiza)de DEAlemán (Alemania)el GRGriegoen AUInglés (Australia)en GBInglés (Reino Unido)en USInglés (Estados Unidos)es ESEspañol (España)fi FIFinésfr CAFrancés (Canadá)fr FRFrancés (Francia)it ITItalianoja JPJaponésko KRCoreanonb NONoruego Bokmalnl NLHolandésnn NONoruego Nynorskpl PLPolacopt BRPortugués de Brasilpt PTPortugués (Portugal)ru RURusosv SESuecozh CNChino Simplificadozh TWChino TradicionalReferencia relacionada:“SYSPROC.SYSTS CREATE” en la página 19Puede llamar al procedimiento almacenado SYSPROC.SYSTS CREATE para crear un índice de búsquedade texto. Este procedimiento almacenado habilita una columna de texto para la indexación de búsquedade texto. A continuación, el índice de búsqueda de texto puede utilizarse en consultas SQL que contenganlas funciones

realizar búsquedas en los índices de texto creados a partir de los documentos almacenados en una tabla de DB2. Los procedimientos almacenados administrativos se utilizan para habilitar e inhabilitar la búsqueda de texto y para crear, actualizar y eliminar índices de texto. 2 IBM i: OmniFind Text Search Server for DB2 for i