Pentaho Sebagai Solusi Masalah Pengolahan Database

Transcription

View metadata, citation and similar papers at core.ac.ukbrought to you byCOREprovided by Universitas Semarang Jurusan: SIJALU - Sistem Informasi Jurnal Ilmiah USMPENTAHO SEBAGAI SOLUSI MASALAHPENGOLAHAN DATABASE(Pentaho as a Solution of Database Processing Problems)Nurtriana HidayatiFakultas Teknologi Informasi dan Komunikasi Universitas SemarangAbstractInformation is the result of data processing plays an important role in anorganization,especially in decision-making process. Pentaho application of Intelligent Business Products isone of the technologies for collecting, storing, analyzing, and providing access to data to helpenterprise users make better business decisions. Pentaho has a function as reporting, analysis,dashboards, data integration (ETL) and data mining. Pentaho is better to manage large andcomplex data and be able to complete the functional organization.Keywords : Pentaho, Database1.PENDAHULUANInformasi adalah fondasi dari tiapkeputusan bisnis penting yang dilakukan.Dalam tiap perusahaan informasi merupakanhal yang perlu diatur dengan konsep yangbenar sesuai proses bisnis yang terjadi.Pembuatan dan penerapan sistem ERPmengintegrasi semua area fungsional dalamperusahaan. Sistem ERP merupakan tulangpunggung dari kebanyakan perusahaanyang mengintegrasikan aplikasi back-officeseperti aplikasi keuangan, pembelian, HR,inventory dan lainnya.Namun, walau suatu sistem ERPdapat mengintegrasi semua data transaksibisnis kedalam masing-masing tabel masteruntukperencanaan perusahaan.ERPbukanlah sistem untuk melakukan analisadata dan proses pendukung keputusan yangpengimplementasiannyabiasadikenalsebagai decision support system.Fungsionalitas pendukung keputusansangat penting untuk suatu perusahaankarena membantu perusahaan merencanakan strategi kedepan dan mengefisiensikanwaktu dalam pembuatan keputusan. Suatusistem Bisnis Intelijen (BI) dapat menyediakanpemetaan data dari suatu sistem ERPdanmenganalisa skenario bisnis yang berjalan karena suatu BI melakukan pengkoleksi-86an data yang didapat dari sistem ERP, CRMatau sistem lainnya dan menghasilkan berbagai macam bentuk analisa. BI menyediakan analisa yang lebih bermakna. Walaupunlaporan-laporan operasional yang disediakanERP memberikan status kondisi bisnis saatini, hal tersebut belum memenuhi keinginanpara manager akan adanya ad hoc, forecasting dan exceptional report lainnya. BIjuga dipakai untuk mengoptimasi investasi dariERP. Suatu system ERP yang diintegrasikandengan aplikasi bisnis intelijen secara kontinudapat meningatkan kelebihan kompetitifnya.Sebagai contoh, hasil dari solusi BI dapatmembuat pegawai pembelian menemukanpattern harga, dimana dapat menyebabkanperusahaan mendapatkan harga yang lebihbaik dengan mengubah proses pembelian.Penemuan-penemuan hasil analisa dari infoyang diberikan oleh BI inilah yang dapatmeningkatkan system dalam ERP.2.KAJIAN PUSTAKAKajian pustaka ini akan menampilkanbeberapa kajian teori yang dipakai dalammembangun aplikasi Bisnis Intelegent (BI),baik dalam pembangunan BI secarainternal, daftar referensi dari semua jenisreferensi seperti buku, jurnal papers, artikel,disertasi, tesis, skripsi, hand outs, laboratoryPentaho Sebagai Solusi Masalah (N. Hidayati)

manuals, dan karya ilmiah lainnya sertamodul-modul yang terkait dalam prosespengintegrasian aplikasi BI dengan ERP.2.1 Bisnis IntelegentBisnis Intelijen (BI),merupakankategori yang luas dari aplikasi danteknologi untuk mengumpulkan, menyimpan,menganalisis, dan menyediakan akses kedata untuk membantu pengguna enterprisemembuat keputusan bisnis yang lebih baik.Secara garis besar teknik yang dipakai dalamBI adalah teknik untuk mengidentifikasi,mengekstraksi, dan menganalisa data-datadari bisnis tertentu berdasarkan kategorikategori yang mempengaruhi, contoh: menganalisa pendapatan penjualan (sales revenue)berdasarkan produk yang dijual dan cabang.Teknologi BI menyediakan akseskepada data-data lampau, saat ini, dandata prediksi dari operasi-operasi bisnis.Adapun fungsionalitas umum dari BI adalah1. Query dan Analysis yang dilakukandengan cara :a. Ad hoc reportingb. analysis tools2. Reporting yang dilakukan dengan cara :a. Dashboardb. Trend Line Analysis3.Plan, Budget and Forecast yang dilakukan dengan cara :a. Plan vs Actualb. Performance Management yangdilakukan dengan cara:a. KPIb. Scorecards4. Berdasar Waktu yang dilakukan dengancara :a. Pengolahan data untuk menjawabpertanyaan-pertanyaan bisnisData yang dipakai dalam BI seringmerupakan Data Warehouse atau Data Mart.Namun, suatu BI tidak selalu membutuhkansuatu data warehouse, dan suatu datawarehouse tidak selalu digunakan untukkeperluan BI.Selanjutnya data di data warehousediproses menggunakan berbagai analisisstatistik dalam proses data mining, sertaanalisa OLAP, sehingga didapat berbagaikecenderungan atau pattern dari data yangmerupakan report dari BI. Yang disajikandengan tool BI yang telah tersedia.Reporttersebut mampu membantu organisasi dalampengambilan keputusan bisnis yang diambilberdasarkan fakta-fakta aktual. Berikut adalahgambaran mengenai konsep BI :Gambar 1 Konsep Business IntelligenceJURNAL TRANSFORMATIKA, Volume 9, No. 2, Januari 2012 : 86 – 9587

2.2 PentahoPentaho merupakan open source BIsekaligus menyediakan platform dan programuntuk membangun suatu aplikasi BI.Pentahoterdiridari banyak programkomputer yang bekerja secara bersamaandan menyediakan solusi bisnis intelijen.Karena terdiri dari berbagai komponen,dimana ada komponen level bawah, namunjuga ada komponen yang menyediakanfungsionalitas level atas n oleh komponen level bawah,keseluruhan koleksi komponen dalamPentaho dapat dilihat seperti stack, yangmana semakin tinggi levelnya maka akansemakin dekat dengan end-user.Keseluruhanprodukpembangunaplikasi BI biasa disebut dengan Pentaho BISuite yang terdiri dari beberapa produk,dimanamasing-masingnyamemilikispesifikasi fungsi tersendiri, antara lain :1. Pentaho Reporting :a. Pentaho Report Designerb. Pentaho Metadata Editor2. Pentaho Analysis :a. Pentaho Schema Workbench3. Pentaho Dashboards :a. Pentaho Design Studio4. Pentaho Data Integration (ETL) :a. Pentaho Data Integration5. Pentaho Data Mining :a. Weka3. STUDI PUSTAKA3.1 Pentaho ReportingPentaho Reporting adalah suatu koleksiproyek open source untuk merancang,menghasilkan dan mendistribusikan laporandengan format tampilan dan sumber data yangkaya dan beragam.Pentaho Reporting ini terdiri dari 2aplikasi yaitu : Reporting Engine yang dapat dimasukkansebagai bagian dari aplikasi Java(embeddable).88 Report Designer yang merupakan utilitasgrafik untuk merancang dan menjalankanlaporan.Adapun fitur-fitur dari Pentaho Reporting iniantara lain : Ad Hoc Report Designer Pentaho. Engine reporting yang bisa di-embed diaplikasi Java. Multi Platform. Dapat mengambil source dari berbagairelational engine. Lihat link berikut untukdatabase relasional yang didukung olehPentaho Reporting. Dapat mengambil source OLAP yangdidukung driverOLAP4J seperti Mondrian,SQL Server Analysis Service, PALO Molap,SAP BW, dan lainnya. Memiliki kemampuan mengambil sourcePentaho Data Integration step. Inimenjadikan source yang dapat diambilhampir menjadi tidak terbatas. Dilengkapi designer yang intuitif dan koleksichart yang lengkap untuk keperluananalisa. Output dalam format PDF, Excel, HTMLdan CSV.a. Pentaho Report DesignerPentaho Report Designer adalah sebuahtools pendukung yang terdapat di dalamPentaho suite. Fungsi utamanya adalahsebagai tools untuk membangun sebuahreport/laporan yang lebih sederhana danproses nya lebih dapat mengefesienkan waktudalam pembuatan sebuah data laporan. Untukdapat menggunakan pentaho report designerkita lakukan sebagai berikut :1. Jalankan Pentaho report designer yangtelahdiinstall,dengancaramengklik Start Æ Pentaho Æ PentahoOpen BI suite Æ Report Designer.2. Jika proses berjalan ditunjukkan olehgambar berikut :Pentaho Sebagai Solusi Masalah (N. Hidayati)

Gambbar 2 : prompt service dari ReportRDesignnerGaambar 3 : ruaang kerja Repoort Designer3.2 Mondrian / Pentaho Analyssis ServerP server yanggMondrian meruupakan OLAPberjalan di atas plattform Java daan bersifat freeeopensoource dan telah digunakan di berbagaaiframewwork BI seperti Peentaho dannJHydeJasper.Innisiator Mondrian adalah Julian(http://juliianhyde.blogsspot.com/) dan sejakdiakuisisiioleh Pentaaho tetap merupakanproject leeader dari MMondrian. Moondrian jugadikenal dengannamadPPentaho AnalysisJURNAAL TRANSFFORMATIKAA, Volume 9,, No. 2, Januuari 2012 : 886 – 9589

a.Arsitektur MondrianGambar 4 : Arsitektur Mondrianb.Schema MondrianSchema di Mondrian merupakan suatufile teks XML yang mendefinisikan model logisdaricube, hirarchies, levels, members danpemetaan dari model ini ke tabel fisik databaserelasional. Tabel-tabel fisik yang merupakansumber data ini biasanya menggunakanpemodelan star schema dimana suatu tabelfisik dikelilingi oleh beberapa tabel dimensitanpa percabangan lebih jauh.¾ Definisi dimension, measure, hierarchy,member dan cellPada konstruksi bahasa pengolahan datarelasional seperti SQL umumnya dirancanguntuk pengambilan data dalam 2 dimensi :kolom (column) dan baris (row). Sedangkan didalam data multidimensi (multidimensionaldata) struktur direpresentasikan lebih dari 2dimensi yang disebut cube. Semua terminologidasar yang terkait dapat digunakan didalamMDX.Skema dari Mondrian mendefinisikanpemetaan dari model logika dari cube,hirarchy, dan member ke tabel dan kolom daridatabase. Skema ini berbentuk file XML.Berikut adalah contoh cara mendefinisikanelemen-elemen dari model multidimensionaldidalam skema:a. Cube Cube name "Penjualan" cache "true"enabled "true" Table name "fact penjualan" /Table 90 /Cube b. Measure Measure name "Total Unit"column "jumlah pembelian" formatString "#,##0"aggregator "sum" /Measure c. Calculated Member CalculatedMember name "YTD" formula "Sum(Ytd([Waktu].CurrentMember),[Measures].[Total Unit])" dimension "Measures" CalculatedMemberProperty name "FORMAT STRING"value "#,##0" /CalculatedMemberProperty /CalculatedMember d. Dimension & Hierarchies (Shared) Dimensiontype "TimeDimension" name "Waktu" Hierarchy hasAll "true" allMemberName "SemuaWaktu"primaryKey "sk waktu" Table name "dim waktu" /Table Level name "Year"column "year" type "Numeric"uniqueMembers "true"levelType "TimeYears"hideMemberIf "Never" /Level Levelname "Quarter" column "quarter"type "Numeric"uniqueMembers "true"levelType "TimeQuarters" hideMemberIf "Never" /Level Levelname "Month" column "month"type "Numeric"uniqueMembers "false"levelType "TimeMonths" hideMemberIf "Never" /Level Levelname "Hari" column "day of month"type "Numeric"uniqueMembers "false"levelType "TimeDays"hideMemberIf "Never" /Level /Hierarchy /Dimension e. Dimension & Hierarchies (Specific) Cube name "Karyawan"defaultMeasure "Total" Table name "hrd fact karyawan" / Dimensionname "Dim Karyawan"Pentaho Sebagai Solusi Masalah (N. Hidayati)

foreignKey "sk karyawan" HierarchyhasAll "true" allMemberName "SemuaKaryawan"primaryKey "sk karyawan"defaultMember "Semua Karyawan" Table name "hrd dim karyawan"/ Level name "Karyawan"column "sk karyawan"nameColumn "nm pgw"uniqueMembers "false"/ /Hierarchy /Dimension . /Cube f. Virtual Cube Cube name "Sales" defaultMeasure "UnitSales" . CalculatedMember name "Profit"dimension "Measures" Formula [Measures].[Store Sales] - [Measures].[StoreCost] /Formula . /CalculatedMember /Cube VirtualCube name "Warehouse and Sales"defaultMeasure "Profit" . VirtualCubeMeasurecubeName "Sales" name "[Measures].[Profit]"/ /VirtualCube g. Role Role name "Californiamanager" SchemaGrantaccess "none" CubeGrant cube "Sales"access "all" HierarchyGranthierarchy "[Store]"access "custom"topLevel "[Store].[StoreCountry]" MemberGrantmember "[Store].[USA].[CA]"access "all" / MemberGrantmember "[Store].[USA].[CA].[LosAngeles]"access "none"/ /HierarchyGrant HierarchyGranthierarchy "[Customers]"access "custom"topLevel "[Customers].[StateProvince]"bottomLevel "[Customers].[City]" MemberGrant member "[Customers].[USA].[CA]"access "all" / MemberGrantmember "[Customers].[USA].[CA].[LosAngeles]"access "none"/ /HierarchyGrant HierarchyGranthierarchy "[Gender]" access "none"/ /CubeGrant /SchemaGrant /Role h. Properties Level name "MyLevel"column "LevelColumn"uniqueMembers "true" Propertyname "MyProp"column "PropColumn"/ Level/ 3.3 Pentaho DashboardDashboard diharapkan dapat membantupemilik perusahaan dalam melakukanmanjemen inventori.Informasi yang disajikandalam bentuk dashboard ini diharapkan dapatmembantu pemilik perusahaan dalampengambilankeputusan.Pembuatandashboard dapat menggunakan berbagaimacam teknologi business intelligence.Sepertioracle, mysql dan pentaho.Macam Dashborddibedakan menjadi 3.Dashboard tactical,strategic dan eksekutif.Perbedaan ard tactical lebih kearah operasional, dashboard strategicalmenghubungkan antara operasional denganvisi misi perusahaan, apakah aktivitasperusahaan sudah sejalan dengan visi misiperusahaan.Dashboard eksekutif memantauaktivitas perusahaan untuk jangka waktupanjang.Dashboarddigunakanuntukmenampilkan variable-variable tertentu yangmerupakan KPI (key performance index),sehingga perlu dipantau dari waktu kewaktu.Berikut adalah contoh dashboard yangbisa anda akses dari BI Developers Examples CDF samples charts sample ChartsamplesGambar 5 : Contoh DasboardJURNAL TRANSFORMATIKA, Volume 9, No. 2, Januari 2012 : 86 – 9591

3.4 Peentaho Data Integration (ETL)Pentahho memiliki berbagai maacam sumbeerdata seeperti : Relaasional denggan memasukkan perintahhSQLL (menggunaakan driver tiaptrelasionaaldataabase). OLAAPEnginedengannperiintah MDX (mmenggunakandriveerMonndrian atau OLAP4J).O Penntaho Metadaata dengan menggunakannperiintah MQL. Penntaho Data Integration (ETL) dengannmemmasukkan nama step yangg digunakan.Dan Pentaho Reporting tentunyya memilikikemampuuan untuk meengambil dataa dari salahsatu summber data terssebut. Pada artikelakali iniakan dittunjukkan peenggunaan datadsourceETL Peentaho Data Integration 4.1 padaPentaho Reporting 3.88.a. Ranncangan Trannsformasi ETTLBerikut adalah rancangan transformasitETL yaang mengammbil data dari table"ms prodduk" database PHI-Minimaart (MySQL)dan file excel Targett Penjualan.xxls. Dengandemikiann mengambil dua sumberr data yangberbeda.Gambbar 6 : Rancaangan Transfoormasi ETLTrransformasi tersebut mengambil dataadari file Excel untuk kemudiaan mengambilreferennsi nama prooduk yang adda pada tableeMySQLL karena padda file Excel tersebut tidakmemilikki data nama produk.Seetelah itu data dinormalissasi, diurutkannberdassarkan namaa produk & bulan dannterakhir dihasilkanddatta summary berdasarkanbnama prooduk dan bulaan.Dataa preview daridstep "Suummarize Nama Prroduk, Bulan SSeluruh Cabaang" tampakpada gammbar berikut di bawah inii. Nah, datainilah yaang akan kitaa sajikan padda PentahoReport. (File transforrmation ini dapatdAndadownloadd pada bagiann akhir artikel ini).GambarG6 : Coontoh Data Prreview92Penntaho Sebaggai Solusi Maasalah (NN. Hidayati)

3.5 Pentaho Data MiningWekaterdiridarikoleksialgoritma machinelearning yangdapatdigunakan untuk melakukan generalisasi /formulasidarisekumpulan datasampling.Walaupun kekuatan Weka terletakpada algoritma yang makin lengkap dancanggih, kesuksesan data mining tetap .Tugas pengumpulan datayang berkualitas tinggi dan pengetahuanpemodelan dan penggunaan algoritma yangtepat diperlukan untuk menjamin keakuratanformulasi yang diharapkan.a. Algoritma Pemodelan / ClassifierWeka saat ini sudah cukup banyakmendukung algoritma untuk pemodelan dataatau biasa disebut classifier, diantaranyaadalah sebagai berikut : J48, atau kloning versi open source darialgoritma C4.5 yang dapat digunakan untukpembentukan pohon keputusan (decisiontree) LinearRegression, algoritma untukmenghasilkan formulasi numerik denganmetode statistik regresi linear Naive Bayes, salah satu classifier numerik dan lain-lainb. Format Data Masukan / InputFormat-format data yang dapat dijadikan inputWeka adalah sebagai berikut : Attribute-Relation File Format (ARFF),adalah tipe file teks yang berisiberbagai instance data yang berhubunganddengan suatu set atribut data yangdideskripsikan juga dalam file tersebut.iris.arff - contoh data Weka dengan formatARFF@RELATION iris@ATTRIBUTE sepallength REAL@ATTRIBUTE sepalwidth REAL@ATTRIBUTE petallength REAL@ATTRIBUTE petalwidth REAL@ATTRIBUTE class ris-setosa4.6,3.4,1.4,0.3,Iris-setosa Comma Separated Values (CSV), file teksdengan pemisah tanda koma (,) yangcukup umum digunakandata.csvNama, Kondisi, AksiFeris, lapar, makanFeris, kenyang, tidurBudi, lapar, makanBudi, kenyang, tidurPHI, lapar, makanPHI, kenyang, makanJon, lapar, makanJon, kenyang, tidur Format C4.5, untuk penjelasan dan contohdari format file ini dapat ndixes/c45.htm Serialisasi data biner oleh Weka4.a.KESIMPULAN DAN SARANKesimpulanPentaho adalahkumpulanaplikasiBusiness Intelligence (BI),Pentaho telah diadopsi untuk melakukan pengolahan data besaroleh berbagai institusi/perusahaan diIndonesia dan sampai saat ini sudah cukupbanyak. Pentaho memiliki berbagai fungsidengan produk yang dimiliki antara lainPentaho, Pentaho Analysisa, PentahoDashboards, Pentaho Data Integration (ETL),Pentaho Data Mining.b. SaranUntuk mengerti dan memahami Aplikasi/Tool Pentaho bahasa Query Sql, OLAP,MOLAP dan ROLAP. Dengan Pentaho dapatmenyelesaikan integrasi data yang besar dankompleks.5. DAFTAR /pentaho-reportdesigner, diunduh 10 April 2012.JURNAL TRANSFORMATIKA, Volume 9, No. 2, Januari 2012 : 86 – 9593

Roldal, M.C, “Pentaho 3.2 Data IntegrationBeginner’s Guide”. on. Diunduh 10 April imasalah kemiskinan negara indonesia.diunduh 10 April 2012Pentaho Sebagai Solusi Masalah (N. Hidayati)

Pentaho application of Intelligent Business Products is one of the technologies for collecting, storing, analyzing, and providing access to data to help enterprise users make better business decisions. Pentaho has a function as reporting, analysis, dashboards, data integration (ETL) and data mining. Pentaho is better to manage large and