GUÍA TÉCNICA Desarrollo De Sistemas De Información La . - Extremadura

Transcription

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la ComunicaciónDesarrollo de Sistemas deInformación con la platafomra BIPentahoGUÍA TÉCNICADesarrollo de Sistemasde Información laplataforma BusinessIntellingence PentahoPágina 1 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADesarrollo de Sistemas deInformación con la platafomra BIPentahoDirección General deTecnologías de la Información y la ComunicaciónControl de versionesVer.Fecha104/07/14DescripciónVersión inicialAutoresSDPPágina 2 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la ComunicaciónDesarrollo de Sistemas deInformación con la platafomra BIPentahoÍndice del DocumentoCapítuloPágina1.- Alcance del documento42.- Plataforma43.- Estructura de la plataforma Pentaho63.1.- Pentaho BI Platform63.2.- Pentaho Data Integrator84.- Inegración de aplicaciones105.- Pentaho Reportint11Página 3 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la ComunicaciónDesarrollo de Sistemas deInformación con la platafomra BIPentaho1.- Alcance del documentoEste documento establece las características técnicas que deben cumplirlas aplicaciones desarrolladas utilizando la plataforma de Business IntelligencePentaho.Se describe el entorno tecnológico existente, el cual hay que tener encuenta a la hora de implementar y testear la compatibilidad de las aplicacionesdesarrolladas.En este documento se establecen los estándares, frameworks y libreríasque deben utilizarse en las aplicaciones a desarrollar, para asegurar unosrequisitos mínimos de calidad y estandarización y una completa compatibilidadcon el entorno, así como facilitar las tareas de despliegue y mantenimiento delas aplicaciones.Todas las aplicaciones desarrolladas utilizando la plataforma de BusinessIntelligence Pentaho deberán respetar las características establecidas en estedocumento. En el caso de necesitarse algún componente (framework, librería,entorno, etc.), tecnología o herramienta no descrita en el documento, elServicio de con competencias en materia de Administración Electrónica deberáconocer este hecho y aprobar su uso.Este documento es complementario a la “Guía Técnica para el desarrollode Sistemas de Información con JAVA”.2.- PlataformaEl entorno tecnológico para las aplicaciones desarrolladas con Pentahopara la Junta de Extremadura es el siguiente: Java Platform, Standard Edition 7.0Es una plataforma de programación para desarrollar y ejecutar softwarede aplicaciones en lenguaje de programación Java con arquitectura de nPágina 4 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la ComunicaciónDesarrollo de Sistemas deInformación con la platafomra BIPentahoniveles distribuida, basándose ampliamente en componentes de softwaremodulares ejecutándose sobre un servidor de aplicaciones.http://java.sun.com/ Apache Tomcat 6Tomcat es un servidor web con soporte de servlets y JSPs. Al estarbasado en Java, Tomcat puede ser utilizado en cualquier sistemaoperativo que lo soporte.Tomcat es mantenido y desarrollado por miembros de la ApacheSoftware Foundation y voluntarios independientes.Tomcat 6.x implementa la especificaciones de Servlet 2.5 y JSP 2.1.Tomcat se utilizará para el despliegue del servidor BI de pentaho.http://tomcat.apache.org/ Pentaho BI Platform 5 CELa plataforma Pentaho BI proporciona una arquitectura e infraestructurapara construir aplicaciones de inteligencia de negocio. Proporcionaservicios como autenticación, auditoría, log, servicios web, etc. Tambiénincluye un motor de solución que integra componentes de reporting,análisis, cuadros de mando y minería de datos.Pentaho BI Server está escrito entéramente en Java, por lo que seejecuta en cualquier entorno J2EE. Así, es compatible con la mayoríaSOs, contenedores Servlet, servidores de aplicaciones y Bases de Datos.http://community.pentaho.com/ Pentaho Data Integrator 5 CEPentaho Data Integrator es una solución ETL (Extracción, Transformacióny Carga) basada en una aproximación dirigida por metadatos. Incluye unentorno gráfico de fácil uso para crear trabajos y transformaciones ETL,consiguiendo un desarrollo más rápido, menores costes demantenimiento, un debug interactivo y un despliegue simplificado.Página 5 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la ComunicaciónDesarrollo de Sistemas deInformación con la platafomra BIPentahoPentaho Data Integrator está 100% construido en java, por lo que esmultiplataforma: Windows, Linux, Macintosh.http://community.pentaho.com/ SQLServer 2008SQLServer es un sistema de bases de datos objeto-relacional, que seráutilizado para dar soporte a las necesidades de persistencia deinformación de la plataforma BI Pentaho 5 CE.Se utilizará como motor de las bases de datos:-Repositorios de Pentaho Data Integrator-Bases de datos de operación del servidor Pentaho BI (quartz,hibernate y jackrabbit).http://www.microsoft.comLas aplicaciones tienen que ser 100% compatibles con esta plataforma.3.- Estructura de la Plataforma Pentaho3.1.- Pentaho BI PlatformLa plataforma de Business Intelligence Pentaho está compuesta, comonorma general, por los siguientes módulos: Un servidor Pentaho BI. El servidor Pentaho BI proporciona laarquitectura e infraestructura para construir las aplicaciones deinteligencia de negocio con Pentaho.El servidor Pentaho BI ya estará disponible en los servidores de lasPágina 6 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la ComunicaciónDesarrollo de Sistemas deInformación con la platafomra BIPentahoConsejerías, por lo que no será entregado como parte de lasaplicaciones. El servidor será utilizado por varias aplicaciones, por lo queno se podrá modificar el servidor ni ninguno de sus componentesy/o librerías para adaptarlo a necesidades específicas de unaaplicación. Un repositorio de soluciones. La plataforma BI accede alrepositorio de soluciones dónde se almacena su configuración y dasuconfiguración, informes, análisis, etc., en una sola solución. Dichasolución se integrará en el repositorio de soluciones de la plataforma. Consola de Administración Pentaho (integrada en la consola de usuario). Se tratade una aplicación web dirigida a los administradores de la plataforma, con utilidades paragestión de usuarios y roles, conexiones a bases de datos, operaciones de mantenimiento de laplataforma, etc. A la consola de administración solo tendrán acceso losadministradores de la plataforma. Consola de Usuario Pentaho. Se trata de una interfaz webdirigida a los usuarios de la plataforma BI en la que pueden ejecutar losinformes, cuadros de mando, análisis, etc., de las distintas aplicaciones(soluciones). Cada usuario tiene acceso a una o varias soluciones enfunción de su rol. La consola de usuario Pentaho será corporativa, con undiseño y logos corporativos y será compartida por todas las aplicaciones.Sin embargo, los usuarios de las aplicaciones no podrán acceder adicha consola, sino que accederán a las aplicaciones o portales web queacceden al servidor Pentaho. Una o varias aplicaciones o portales web. Cada aplicación puedeestar formada por una o varias aplicaciones o portales web, que accedana los informes, cuadros de mando, etc., de su solución a través de laplataforma BI. La integración con la plataforma se realizaráutilizando servicios web. Una o varias fuentes de datos. La plataforma tendrá acceso a lasfuentes de datos (bases de datos, ficheros, etc.) que exploten lasdistintas aplicaciones. Los datasources a utilizar por las aplicacionesestarán definidos en sus soluciones, y la configuración de lasconexiones a base de datos se realizarán desde la consola dePágina 7 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la ComunicaciónDesarrollo de Sistemas deInformación con la platafomra BIPentahoadministración de la plataforma. Plataforma PBI3.2.- Pentaho Data IntegratorLa solución ETL Pentaho Data Integrator está compuesta, como normageneral, por los siguientes módulos: Repositorios ETL. Pentaho Data Integrator almacena los trabajos ytransformaciones ETL en repositorios de ficheros XML o en repositoriosen base de datos.En nuestro caso, cada aplicación almacenará su repositorio detrabajos y transformaciones en una instancia de base de datos.Página 8 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la Comunicación Desarrollo de Sistemas deInformación con la platafomra BIPentahoHerramienta de Integración de Datos Spoon. La herramienta Spoon esun interfaz gráfico que permite gestionar repositorios, crear trabajos ytransformaciones ETL, ejecutar transformaciones, etc.Esta herramienta estará instalada en un servidor y a ella tendránacceso los administradores de la plataforma. Herramienta de Integración de Datos Kitchen. La herramienta Kitchenpermite ejecutar trabajos y transformaciones ETL desde línea decomandos.Esta herramienta estará instalada en un servidor y en este mismoservidor se podrán definir las tareas programadas que ejecuten trabajosETL mediante Kitchen. sytransformaciones ETL, incorporando las librerías de Pentaho DataIntegrator: kettle-core.jar kettle-db.jar kettle-engine.jar kettle-ui-swt.jarEstas aplicaciones deberán incorporar un fichero properties en el quedefinir el repositorio de trabajos y transformaciones ETL, así como lascredenciales de acceso al mismo.Los trabajos y transformaciones que ejecuten las aplicacionesserán procesos internos y no tendrán acceso ni a las fuentes dedatos ni a la base de datos del datawarehouse. Una o varias fuentes de datos. La plataforma tendrá acceso a las fuentesde datos (bases de datos, ficheros, etc.) que intervengan en los distintosprocesos ETL. Los datasources a utilizar por los procesos ETL estarándefinidos en los repositorios, y serán administrados mediante laherramienta Spoon por los administradores de la plataforma.Página 9 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la ComunicaciónDesarrollo de Sistemas deInformación con la platafomra BIPentahoPlataforma PDI4.- Integración de aplicacionesComo ya se ha comentado antes, la integración de las aplicaciones(aplicaciones web java o portales web liferay) con pentaho BI server serealizará utilizando los servicios web de pentaho. Para ello, lasaplicaciones deben disponer de un fichero de propiedades que permitaindicar los parámetros de acceso a los servicios web: url. usuario.Página 10 de 11

GUÍA TÉCNICAJUNTA DE EXTREMADURADirección General deTecnologías de la Información y la Comunicación Desarrollo de Sistemas deInformación con la platafomra BIPentahoPassword.Por otro lado, no está permitido hacer uso del visor OLAP JPivot, yaque en una plataforma pentaho BI compartida por varias aplicaciones elrendimiento es prioritario, y el uso de consultas OLAP a través de JPivotpenaliza en gran medida el rendimiento.Las aplicaciones pueden hacer uso de los informes generados porpentaho, si bien es recomendable que, en la medida de lo posible, losinformes generados sean almacenados para su consumo por otrosusuarios, evitando repetir la consulta cada vez que se solicite el informe.Los usuarios accederán a los informes, cuadros de mando, etc., através de una aplicación o portal web integrado con la plataforma, yaque no tendrán acceso a la consola de usuario de la plataforma Pentaho BI.5.- Pentaho ReportingEl motor de informes utilizado en las aplicaciones basadas en Pentaho esel de librerías Pentaho Reporting SDK disponible en la plataforma Pentaho BIbasado en los productos Open Source JfreeReport y JfreeChart.Página 11 de 11

La solución ETL Pentaho Data Integrator está compuesta, como norma general, por los siguientes módulos: Repositorios ETL. Pentaho Data Integrator almacena los trabajos y transformaciones ETL en repositorios de ficheros XML o en repositorios en base de datos. En nuestro caso, cada aplicación almacenará su repositorio de