AP3 - Pentaho - ETL

Transcription

15/04/2013FaculdadePitágorasCurso Superior de Tecnologia:Banco de DadosDisciplina: Ferramentas paraTomada de DecisãoPentaho - ETLCrédito dos Slides:Clever JuniorProf.: Fernando Hadad Zaidan2Se ainda não tem o PDI Baixar do site: http://community.pentaho.com/ETL UtilizandoPentaho Data IntegrationPDI (Kettle)3Baixar a Ferramenta e descompactar na pasta do Pentahohttp://community.pentaho.com/ - obre a ferramenta Data Integration (PDI) é uma ferramenta muitopoderosa de extração, tratamento e carregamentode dados; É uma ferramenta da empresa do Pentaho; Não é utilizada “apenas” para a carga de DW; Ela extrai (de diversas fontes), trata, e carrega osdados sobre uma outra base de dados( DataWarehouse ).5Data-integration (nome gerado)61

15/04/2013Para iniciar o PDI: Spoon.batNeste caso, vai carregar um aplicativo. Fechar duas janelas na inicialização.7910O mesmo para Output – Colocar um Table Output11122

15/04/20131314151617183

15/04/20131920212223244

15/04/20132526Alguns Macetes27Não usar o componente Table Output para gravar, pois gravaráos mesmos registros toda vez que rodar. Utilizar o Insert/Update(também do Output). Em uma carga inicial, o Table Output éinteressante.Na tabela fato, verificar se as chaves surrogate dasdimensões serão suficientes para não haver KeyViolation, ou se precisará de uma outra chave paradesambiguar.5

15/04/2013Utilizar o Codigo de cada tabela dimensão como chavede Negócio. Esta chave será utilizada para Localizar osIDs no DW no componente Database lookupPara a carga da tabela Fato, criar um componenteDatabase lookup e um Select Values para cadaDimensãoReferênciasPentaho História. Disponível em ntaho Acesso em: 09 fev. 2012.Bons Estudos!Pentaho. Disponível em http://www.pentaho.com Acesso em: 19 fev. 2012.Prof. Zaidan – www.fernandozaidan.com.brBlog Professor Coruja. Disponível em http://blog.professorcoruja.com Acesso em: 19fev. 2012.Pentaho Community. Disponível em http://community.pentaho.com Acesso em: 19fev. 2012.“Quando me permito ser o que sou,torno-me aquilo que deveria ser.”Lao TzuPentaho BI Suite – Enterprise Edition Intro. Disponível em http://www.youtube.com/watch?v Vy2coaxJfCo Acesso em: 20 fev. 2012.346

Pentaho Data Integration PDI (Kettle) 3 Se ainda não tem o PDI . Data Integration (PDI) é uma ferramenta muito poderosa de extração, tratamento e carregamento de dados; É uma ferramenta da empresa do Pentaho; Não é utilizada "apenas" para a carga de DW;