Leseprobe Stefan Müller, Christopher Keller Pentaho Und Jedox Business .

Transcription

LeseprobeStefan Müller, Christopher KellerPentaho und JedoxBusiness Intelligence-Lösungen: Data Warehousing, Reporting, Analyse,PlanungHerausgegeben von Sebastian WenzkyISBN (Buch): 978-3-446-43897-2ISBN (E-Book): 978-3-446-44125-5Weitere Informationen oder Bestellungen -2sowie im Buchhandel. Carl Hanser Verlag, München

InhaltVorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1IXBusiness Intelligence im Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11.1 Business Intelligence: die Verwandlung von Daten in Informationen . . . . . . . . .1.2 Data Warehouse: das zentrale Datenlager des Unternehmens . . . . . . . . . . . . . . . .1.3 Reporting und Dashboards: die maßgeschneiderte Verteilungvon Informationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1.4 Online Analytical Processing: mit Daten würfeln das Business verstehen . . . . . .1.5 Data Mining: unbekanntes Wissen in den Daten entdecken . . . . . . . . . . . . . . . . .1.6 Open Source trifft BI: vom Nischen- zum Mainstream-Player . . . . . . . . . . . . . . . .1.7 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1411142021252Pentaho: Business- und Big-Data-Analysen . . . . . . . . . . . . . . . . . . . . . . . 272.12.22.32.42.5Pentaho im Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Warum Pentaho? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Community vs. Enterprise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Community oder Enterprise Edition im Unternehmenseinsatz . . . . . . . . . . . . . . .Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27303234353Los geht’s: Pentaho installieren und konfigurieren . . . . . . . . . . . . . . . 373.13.23.33.43.53.63.7Installation Pentaho BA-Server . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Zugriff auf die User Console . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Verwaltung der Lizenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Anlage von Datenverbindungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Sicherheitseinstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Einrichtung der E-Mail-Dienste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .37434646495050

VI Inhalt4Pentaho User Console . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.14.24.34.44.54.64.74.84.9Überblick der Pentaho User Console . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Reporting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Scheduling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Interactive Reporting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Analyzer Reports . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Dashboards . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Marketplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Mobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5Pentaho Data Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 835.15.25.35.45.5Pentaho Data Integration im Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83Aufbau eines Star-Schemas mit Pentaho Data Integration . . . . . . . . . . . . . . . . . . . 92Big Data und Pentaho Data Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114Data Mining und Pentaho Data Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1366Pentaho Reporting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1376.1 Pentaho Report Designer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6.1.1 Überblick des Report Designers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6.2 Definition von Datenquellen und Abfragen im Report Designer . . . . . . . . . . . . . .6.3 Entwicklung des ersten Berichts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6.4 Erweiterte Berichtsfunktionen am Beispiel eines MDX-Berichts . . . . . . . . . . . . . .6.5 Berichtsverteilung mit Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6.6 Reportentwicklung für Big Data Stores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6.7 Pentaho Interactive Reporting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6.8 Metadaten für Reporting und Analysen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6.9 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pentaho Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1957.17.27.37.47.5Mondrian im Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .OLAP-Würfel mit der Pentaho Schema Workbench erstellen . . . . . . . . . . . . . . . . .Bessere Performance mit dem Aggregation Designer erreichen . . . . . . . . . . . . . .Flexible Analysen für Big Data Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8Pentaho Dashboards – von Self Service bis maßgeschneidert . . . . 2311951992132192298.1 Self Service Dashboards für Endanwender mit demPentaho Dashboard Designer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2328.2 Maßgeschneiderte Dashboards mit den Pentaho CTools . . . . . . . . . . . . . . . . . . . . 2418.3 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253

Inhalt    9Jedox: Self Service BI und Performance Management . . . . . . . . . . . . 2559.1 Jedox: Self Service BI und Performance Management . . . . . . . . . . . . . . . . . . . . . . 2569.2 Versionsübersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25910 Los geht’s: Jedox installieren und konfigurieren . . . . . . . . . . . . . . . . . . 26110.1 Installationsvarianten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26110.2 Exemplarische Installation aller Komponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26310.3 Konfiguration des Servers für den Zugriff externer Clients . . . . . . . . . . . . . . . . . . 26911 Installations verzeichnis & Ordner strukturen . . . . . . . . . . . . . . . . . . . . . 27312 Jedox for Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27512.112.212.312.412.5Add-in mit dem OLAP-Server verbinden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Der Dialog „Ansicht einfügen“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Datenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Der Dialog „Elemente einfügen“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Entwicklung von Datenstrukturen – Modeller . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12.5.1 Erstellen einer neuen Datenbank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12.5.2 Anlegen der Dimensionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12.5.3 Erstellen eines Würfels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12.6 Dateneingabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12.6.1 Splashing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12.6.2 Import-Assistent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27727928428829229329430130230230413 Jedox Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30914 Jedox Web – Datei-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31314.1 Funktionsweise Datei-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.2 Funktionsweise Arbeitsmappe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.3 Entwicklung von Berichten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.3.1 Anlegen des Berichts (inkl. Überschriften) . . . . . . . . . . . . . . . . . . . . . . . . .14.3.2 Anlegen der Combo-Boxen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.3.3 Anlegen des Datenbereichs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.3.4 Platzieren des DynaRanges und des Datenbereichs . . . . . . . . . . . . . . . . . .14.3.5 Einbinden des Diagramms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.3.6 Einbinden der individuellen Bilder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.4 Weitere Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.4.1 Hilfreiche Zusatzfunktionen im Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14.4.2 Verwendung von Variablen und benannten Bereichen . . . . . . . . . . . . . . .14.4.3 Macro-Engine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .313315319321322330336345349349349351356VII

VIII Inhalt15 Berichts-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35915.1 Funktionsweise Berichts-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35915.2 Erweiterte Berichtserstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36116 ETL-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36316.1 ETL-Menü . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.2 ETL-Komponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.2.1 Verbindungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.2.2 Extraktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.2.3 Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.2.3.1 Transformationsschritt „Field Transform“ . . . . . . . . . . . . . . . . . .16.2.3.2 Transformationsschritt „Table Join“ . . . . . . . . . . . . . . . . . . . . . . .16.2.3.3 Transformationsschritt „Table Transform“ . . . . . . . . . . . . . . . . . .16.2.3.4 Transformationsschritt „Table View“ . . . . . . . . . . . . . . . . . . . . . .16.2.3.5 Transformationsschritt „Tree FH“ . . . . . . . . . . . . . . . . . . . . . . . . .16.2.3.6 Weitere Transformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.2.4 Laden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.2.5 Job . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.2.6 Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16.3 Beispiel ETL-Prozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36536636636837637738138238738739039139539740017 Task- und OLAP-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41117.1 Task-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17.1.1 Batch PDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17.1.2 ETL Jobs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17.2 OLAP-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41141141441518 System-Manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41718.1 Grundlegende Optionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41718.2 Benutzerberechtigungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41819 Jedox Mobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42520 Potenziale von Pentaho und Jedox zusammenführen . . . . . . . . . . . . . 42920.1 Pentaho und Jedox in der Gegenüberstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42920.2 Pentaho und Jedox im Zusammenspiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43120.3 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433

VorwortBeschäf tigt man sich mit Business Intelligence und durchsucht das Internet, wird manschnell mit Phrasen wie „Daten sind das neue Öl“ oder „Wer die Daten hat, hat die Macht“konfrontiert. Daten bzw. die enthaltenen Informationen werden immer wichtiger für Unter nehmen. Wer seine Kunden am besten kennt oder am schnellsten auf geänderte Markt bedingungen reagieren kann, generiert Wettbewerbsvorteile und kann sich von seinenMarktbegleitern absetzen. Voraussetzung ist, die Daten schnell und zuverlässig zu erhebenund auszuwerten. Nur so kann man die Schätze aus den eigenen Datenbanken und IT-Sys temen heben.Als Berater für Business Intelligence und Big Data führen wir entsprechende Lösungen seitmehreren Jahren in einer Vielzahl von Projekten ein. Als Software verwenden wir in diesenProjekten die Tools von Pentaho oder Jedox, um Daten zu extrahieren, zu veredeln und somit in wertvolle Informationen zu verwandeln. Dieses Buch stellt die beiden Lösungenvor. Nach einer kurzen allgemeinen Einführung in das Thema Business Intelligence wird imersten Teil des Buches die Software von Pentaho vorgestellt. Pentaho bietet einen voll ständigen Ansatz für Business Intelligence und Big Data Analytics. Der zweite Teil diesesBuches stellt die BI-Software von Jedox vor. Jedox ist ebenfalls eine vollständige BI-Plattformund bietet zudem die Möglichkeit, umfangreichen Planungsapplikationen zu entwickeln.Neben der Vorstellung der beiden Software-Suiten sind in den jeweiligen Kapiteln auchpraktische Beispiele hinterlegt.www.downloads.hanser.deHier steht ein Teil der Beispiele zum Download bereit, entsprechende Hinweisesind in den Kapiteln hinterlegt. So können Sie direkt mit den Tools arbeiten unddie Beispiele besser nachvollziehen.Sowohl Pentaho als auch Jedox haben sich in unseren Projekten mehr als bewährt und dieAnwender überzeugt. In diesem Sinne wünschen wir Ihnen viel Spaß beim Lesen und Aus probieren – und vor allem viel Erfolg für Ihre eigenen Business Intelligence-Vorhaben.Viele GrüßeStefan Müller und Christopher KellerFulda, im Dezember 2014

2Pentaho:Business- und Big-DataAnalysenPentaho ist der weltweit führende Anbieter von Open-Source-Business- und Big-Data-Ana lytics-Software. Pentaho ist eine flexible und offene Business-Intelligence-Plattform. Sie un terstützt Unternehmen dabei, die richtigen Entscheidungen auf operativer und strategi scher Ebene zu treffen. Innerhalb der Plattform existieren Lösungen für Datenintegration,Analyse, Reporting, Data Mining und Mobile BI. Weiterhin existieren Schnittstellen zu allengängigen Big Data Stores. Durch die enge Kopplung von den Datenintegrations- und Ana lysefunktionen können auch sehr große Datenmengen mit Pentaho und den neuen BigData-Technologien analysiert werden.Kapitel 2 ist der Einstieg in den Bereich Pentaho dieses Buches. In Abschnitt 1 wird einerster Überblick der Software mit seinen einzelnen Modulen gegeben. Weiterhin lesen Sie,warum Pentaho als Business-Intelligence-Software im Auswahlprozess zu berücksichtigenist und wie sich die Community- von der Enterprise-Version abgrenzt. Schließlich wird nochdas Geschäftsmodell der Enterprise-Version von Pentaho erläutert. 2.1 Pentaho im ÜberblickDas Unternehmen Pentaho wurde im Jahr 2004 von fünf Gründern ins Leben gerufen. DerHauptsitz des Unternehmens ist in Orlando in den USA. Von Beginn an war es die Idee, eineCommercial-Open-Source-BI-Plattform als Alternative zu den bestehenden proprietärenSystemen ins Leben zu rufen. Seit dieser Zeit hat Pentaho eine steile Entwicklung durch laufen und offeriert eine moderne, integrierte Plattform für Business und Big Data Ana lytics. Pentaho beheimatet und verantwortet die populären Open-Source-BI-Projekte Kettle,Mondrian, JFreeReport und Weka. Pentaho verfolgt ein subskriptionsbasiertes Geschäfts modell. Die Software von Pentaho wird in 185 Ländern von über 1000 Enterprise-Kundengenutzt. Berücksichtigt man die Zahl der Community-Editionen, ist die Zahl der Anwendersicherlich noch deutlich größer.

282 Pentaho: Business- und Big-Data-AnalysenBild 2.1 Übersicht PentahoDie Pentaho-Plattform ist höchst modular aufgebaut und erweiterbar. Nachstehend ist eineÜbersicht der einzelnen Komponenten zu finden. Die folgenden Kapitel stellen die einzel nen Bausteine theoretisch und praktisch vor.Pentaho Data IntegrationHinter Pentaho Data Integration (PDI) steht das Open-Source-Projekt Kettle. Mit PDI lassensich Jobs und Transformationen für den Aufbau eines Data Warehouse entwickeln. Es exis tieren zahlreiche Schnittstellen zu den unterschiedlichen Datenformaten und Datenbanken.Neben den klassischen Datenquellen können mit PDI auch Informationen aus Big DataStores ausgelesen und verarbeitet werden. PDI ist ein mächtiges Werkzeug für den Zugriff,die Aufbereitung und die Bereitstellung von Daten aus den unterschiedlichsten Quellen innerhalb einer BI-Architektur.Pentaho ReportingPentaho bietet unterschiedliche Funktionen im Bereich Reporting von interaktiven „SelfService“-Berichten bis hin zu hochformatierten Standardberichten. Mit Pentaho InteractiveReporting steht eine webbasierte Drag-and-Drop-Oberfläche für Endanwender für die Er stellung von Ad-hoc-Berichten zur Verfügung. Der Ursprung von Pentaho Reporting ist dasOpen-Source-Projekt JFreeReports. Mit dem Report Designer werden pixelgenaue Berichteerstellt und in unterschiedlichen Formaten an die Empfänger im Unternehmen verteilt.Pentaho AnalysisZur Bereitstellung von mehrdimensionalen Analysen nutzt Pentaho den open-source-basier ten OLAP-Server Mondrian. Mondrian nutzt relationales OLAP und setzt somit auf ein Starschema in einer relationalen Datenbank auf. In Abhängigkeit der eingesetzten Edition

2.1 Pentaho im Überblickstehen unterschiedliche OLAP-Oberflächen zur Verfügung. Der Pentaho Analyzer ist Be standteil der Enterprise Edition. Die webbasierte Drag-and-Drop-OLAP-Oberfläche er möglicht die Navigation durch die Datenwürfel, die Visulisierung der Informationen sowiederen Export in unterschiedliche Formate. Die Community Edition nutzt im Standard JPivotals Oberfläche. Alternativ kann bspw. auch SAIKU aus dem dem Pentaho-Community-Um feld genutzt werden.Pentaho DashboardsAuch bei der Erstellung von Dashboards gibt es Unterschiede hinsichtlich der genutztenEdition. Anwender der Enterprise Edition von Pentaho haben mit dem Dashboard Designerdie Möglichkeit, Cockpits eigenständig in einer Oberfläche zusammenzustellen. Für die Er stellung der Dashboards befüllen die User Templates mit Tabellen, Charts, Reports oderOLAP-Ansichten. Bei Nutzung der Community Edition oder bei hohen Ansprüchen an dieGestaltung bleibt die Erstellung von Dashboards Entwicklern vorbehalten. Diese Dash boards lassen sich maßgeschneidert gestalten und werden mit den Open-Source-Erweite rungen der CTools erstellt.Pentaho Predictive AnalysisDas Open-Source-Projekt Waikato Environment for Knowledge Analysis (Weka) kann für dieSuche nach Mustern in den Datenbeständen genutzt werden. Weka stellt eine Vielzahl vonAlgorithmen für Data-Mining-Aufgaben bereit. Hierzu gehören bspw. Funktionen zur Re gressions- oder Clusteranalyse. Basierend auf den entdeckten Mustern lassen sich zu künftige Trends aus den Daten ableiten.Pentaho Business Analytics ServerDer Pentaho Business Analytics (BA) Server ist der Kern der Architektur und eine Eigen entwicklung des Herstellers. Der Server hostet zum einen die auf der Plattform erstelltenInhalte und zum anderen den von den Designwerkzeugen publizierten Content. Über denBA-Server werden Reports. OLAP-Analysen und Dashboards den Anwendern zur Verfügunggestellt. Weiterhin ermöglicht die BA-Plattform die zeitgesteuerte Erstellung von Berichten,die Verwaltung der Security sowie der genutzten Datenquellen.Pentaho MobilePentaho Mobile ist eine weitere Möglichkeit für den Zugriff auf die Inhalte des BA-Serversüber ein Apple iPad. Es handelt sich um eine Web-App zum Abruf der Reports, aber auchfür die interaktive Erstellung von OLAP-Analysen. Die Bedienung ist für die Nutzung miteinem Tablet-PC optimiert. Mit einer bestehenden Internetverbindung kann ein mobilerZugriff von überall erfolgen.Pentaho Open Source Plug-insDie Pentaho-Plattform ist durch ihren modularen Aufbau erweiterbar. Rund um das Unter nehmen bzw. das Produkt Pentaho hat sich eine Community entwickelt, die derartige Erwei terungen unter Open-Source-Lizenz zur Verfügung stellt. Ab der Pentaho-Version 5 könnendiese Plug-ins über einen Marketplace per Knopfdruck installiert werden. Prominente Ver 29

302 Pentaho: Business- und Big-Data-Analysentreter sind die CTools und Saiku. CTools steht für Community Tools und eine Sammlung vonPlug-ins des Unternehmens Webdetails. Weit verbreitet für die Erstellung von Dashboardssind das Community Dashboard Framework (CDF), der Community Dashboard Editor (CDE)und die Community Charting Components (CCC). Saiku steht zum einen für einen OLAPClient und zum anderen für ein Ad-hoc-Reportingwerkzeug. 2.2 Warum Pentaho?Der Markt für Business-Intelligence-Software wird von einer Vielzahl von Teilnehmern ge prägt. Evaluiert man eine solche Software für den Einsatz im eigenen Unternehmen, wirdman mit einem äußerst vielfältigen Angebot konfrontiert. Auf der einen Seite trifft man dasstellenweise unüberschaubare Angebot der Megavendors, auf der anderen Seite gibt es dieAnbieter mit hochspezialisierten Lösungen. Warum sollte man sich in diesem hoch differen zierten Markt für Pentaho als BI-Plattform im Unternehmen unterscheiden? Nachstehendfinden Sie fünf Gründe, warum Pentaho bei der Evaluierung berücksichtigt werden sollte:Integrierte BI-PlattformWo Pentaho drauf steht, ist auch Pentaho drin. Die vollständige Plattform stammt komplettvon Pentaho bzw. besteht aus Bestandteilen unter der Kontrolle von Pentaho. Pentaho bieteteine umfassende Lösung für Ihre Business-Intelligence-Applikation aus einer Hand. BeideAspekte sind keineswegs Standard bei derartiger Software und bringen eine Reihe von Vor teilen mit sich. Die Vollständigkeit des Angebots bezieht sich auf die Möglichkeit, die Archi tektur komplett mit Pentaho-Mitteln bewirtschaften zu können. Es gibt also nicht nur eineETL-Komponente, sondern auch Werkzeuge für die Darstellung und Verteilung der Infor mationen. Man muss sich also keiner Drittsoftware bedienen, um einzelne Funktionsberei che abdecken zu können. Dieses Angebot aus einer Hand kann bspw. bei Supportfällen vonVorteil sein. Die Verantwortung für das korrekte Zusammenspiel der Komponenten liegtnur bei Pentaho. Als Anwender hat man nur einen Ansprechpartner, auf welchen man beiProblemen zugehen kann. Weiterer Vorteil eines derart integrierten Ansatzes sind die minimalen Reibungsverluste an den Schnittstellen zwischen den einzelnen Komponenten.Als Anwender merkt man durch die Integration der einzelnen Werkzeuge an vielen Stellen,dass die gesamte Software von einem Hersteller stammt. Viele Prozesse lassen sich durch gängig gestalten, sodass etliche Abläufe erleichtert werden. Ein gutes Beispiel ist sicherlichPentaho Data Integration, welches die Basis für eine Vielzahl an Funktionen innerhalb derPlattform ist. So lassen sich die aufbereiteten Daten zum Beispiel direkt innerhalb von PDIvisualisieren und auswerten.Einfache ErweiterbarkeitPentaho bietet eine offene, skalierbare Architektur für vielfältige Erweiterungen der BI- Lösungen. Pentaho ist eine moderne, zu 100 % aus Java bestehende Plattform. Es werdenoffene Industriestandards genutzt, um die Software nahtlos in die eigenen Systeme inte grieren zu können. Bestehende Security Frameworks können von dem BI-System ebenso

2.2 Warum Pentaho?genutzt werden, wie die Anwendung durch offene APIs um Charts und Grafiken von Dritt anbietern erweitert werden kann. Nicht nur Desktop-Anwendungen, sondern auch mobileApplikationen auf Smartphones und Tablet-PCs können um analytische Komponenten er weitert werden. Die Offenheit und Flexibilität von Pentaho ermöglicht die Entwicklungpassgenauer analytischer Systeme im Unternehmen und stellt auch die Umsetzbarkeitkünftiger Anforderungen an diese Lösungen sicher. Durch den Open-Source-Ansatz istPentaho weiterhin nicht nur eine hervorragende Option für Stand-alone-, sondern auch füreingebettete Business Intelligence. Pentaho lässt sich hierbei mit unterschiedlicher Tiefe inbestehende Applikationen integrieren. Vom Customizing der User-Oberfläche bis hin zurEinbettung des Source-Codes in die eigene Applikation sind viele Varianten denkbar.Breites Spektrum an AnalysemöglichkeitenDie Anwender einer Business-Intelligence-Lösung haben höchst unterschiedliche Anfor derungen an den Zugriff auf Informationen. Pentaho bietet vielfältige Frontends für dieunterschiedlichen Anwendergruppen im Unternehmen. Mit Pentaho Reporting lässt sichein Standardberichtswesen umsetzen. Mit diesen eher statischen Auswertungen wird dieMehrheit der Anwender automatisiert mit Informationen versorgt. Pentaho Analysis ist dasWerkzeug für Poweruser. Pentaho arbeitet im OLAP-Umfeld mit unterschiedlichen relatio nalen Datenbanken zusammen. Unter anderem können auch spezielle analytische Daten banken genutzt werden. Diese Gattung an Datenbanken nutzt verschiedene Technologienfür die Beschleunigung der Abfragen gegen den OLAP-Server. Durch die Erhöhung der Ab frageperformance können mit Pentaho sehr große Datenmengen mit den leistungsstarken,anwenderfreundlichen Analyseoberflächen ausgewertet werden. Pentaho Analysis kann indiesen Szenarien sehr gut skalieren. Weiterhin kann die Analyseoberfläche durch beschrie bene Erweiterbarkeit um Visualisierungen erweitert werden. Hierbei können bspw. auchSpezial-Charts für die Auswertung großer Datenmengen genutzt werden. Zum Beispiel kön nen Heatmaps oder Chord-Diagramme Analysten dabei unterstützen, Muster und Auffäl lig keiten zu entdecken.Innovativität durch Open SourceNeben der Flexibilität und Erweiterbarkeit von Open Source profitiert Pentaho von der Innovativität von open-source-basierter Software. Pentaho verfügt über eine aktive Commu nity, welche die Software testet und weiterentwickelt. Auch hier ist PDI wieder ein gutesBeispiel. Seit vielen Jahren wird das ETL-Werkzeug um Komponenten und Schnittstellenaus der Community erweitert. Anwender entwickeln spezielle Schnittstellen für das Ausle sen verschiedener Datenquellen oder Komponenten für die Verarbeitung der Daten. Durchden Einsatz in den unterschiedlichsten Szenarien ergibt sich eine Vielzahl von Erweiterun gen, die in die Software einfließen und von allen Anwendern genutzt werden kann. Auch inden übrigen Bereichen von Pentaho existieren interessante Open-Source-Erweiterungendes BI-Servers. Die CTools ermöglichen bspw. die Entwicklung hoch individueller Dash boards, sind Open Source und stehen zur freien Verfügung. Ein weiteres Beispie

28 2 Pentaho: Business- und Big-Data-Analysen Bild 2.1 Übersicht Pentaho Die Pentaho Plattform ist höchst modular aufgebaut und erweiterbar. Nachstehend ist eine Übersicht der einzelnen Komponenten zu finden. Die folgenden Kapitel stellen die einzel nen Bausteine theoretisch und praktisch vor. Pentaho Data Integration