Big Data, BI, NoSQL, SGBD, Big Data Et NoSQL - ORSYS

Transcription

Big Data, BI, NoSQL, SGBD, Big Data et NoSQLFace à l'explosion quantitative des données produites et collectées (capteurs, réseauxsociaux, contenus multimédias, transactions.), les technologies Big Data offrent de nouvellesperspectives : analyse rapide de grands volumes de données, identification en temps réeldes informations clés. Les stages ORSYS permettent de maîtriser les différentes solutionsproposées par les acteurs du Big Data (Hadoop, Spark, Storm, Cloudera, Talend, Tableau,ELK.) de l'administration des infrastructures jusqu'à l'organisation, l'analyse et la visualisationdes données.Etat de l'art, conceptionBig Data, état de l'art. p.3(réf. BGA)Big Data, synthèse technique(réf. BAG). p.5Big Data, Data Science, Machine Learning, leur impact dans l’entrepriseBig Data Foundation, certification(réf. BDT)Bases de données NoSQL, enjeux et solutions(réf. NSQ)(réf. BID). p.11. p.13. p.15(réf. DMI)Master Data Management, la gouvernance des données(réf. CYE)Deep Learning et réseaux de neurones : les fondamentauxMachine learning, l'état de l'art. p.7. p.9Big Data, méthodes et solutions pratiques pour l'analyse des donnéesData Mining : synthèse(réf. BMD)(réf. MLE). p.17(réf. DRN). p.19. p.21Machine learning, méthodes et solutions(réf. MLA). p.23Microsoft Azure Machine Learning, développer et exploiter des algorithmesHadoop, installation et administration(réf. HOD)Elasticsearch, administration et exploitation. p.25. p.27(réf. ELA)Apache Cassandra, administration et exploitationMongoDB, mise en œuvre et administration(réf. AZL). p.29(réf. SSA)(réf. MGO). p.31. p.33Talend Open Studio for Big Data, exploiter vos données massives(réf. TAD)SQL Server 2016 Business Intelligence, nouveautés pour le Big Data. p.35(réf. MOV). p.37Recherche et DatavisualisationElasticSearch, Logstash et Kibana : indexation, recherche et visualisation de donnéesp.39Data Clustering, organiser les données du Big DataDévelopper des applications de DataVisualisation(réf. DAU)(réf. DTV)(réf. ELK). p.41. p.43DataVisualisation, créer des reportings visuels et interactifs avec Power Map et Power Viewp.45Tableau Desktop, exploiter visuellement vos donnéesStatistiques descriptives, introductionModélisation statistique(réf. STA)(réf. UES).(réf. TBL)(réf. AVI). p.47. p.49. p.51Environnement R, traitement de données et analyse statistiqueTechnique de Big Data Analytics avec R(réf. DTA)Technique de Big Data Analytics avec Python(réf. TDA). p.53. p.55(réf. BDA). p.57ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 1.

Environnement R, manipulations et statistiques élémentaires(réf. MDR)Traitement de données Big Data en temps réel avec Spark et StormApache Hadoop, développer des applications pour le Big DataMongoDB, prise en main et développement(réf. MNO)Spark, développer des applications pour le Big Data. p.59(réf. DSS)(réf. APH). p.61. p.63. p.65(réf. SPK)Apache Storm, développer des applications pour le Big DataMapReduce et Aggregation Framework pour MongoDB. p.67(réf. ASB)(réf. RAG). p.69. p.71100% E-LearningIntroduction à la datavisualisation, collecter, traiter et représenter les donnéesHbase, introduction à la base de données NoSQL d'Hadoop(réf. 4TG)(réf. 4TF). p.75Redis, présentation de la base de données NoSQL pour une utilisation en PHPHDFS, utiliser le système de fichiers distribué d'Hadoop(réf. 4TO). p.73(réf. 4TH). p.77. p.79MapReduce, appliquer le paradigme dans tous les langages et le transposer sous Hadoopp.81Big Data, introduction à la plateforme Hadoop et à son écosystème(réf. 4TX)ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78(réf. 4TP). p.83page 2.

Séminaire de 2 jour(s)Réf : BGAParticipantsDSI, directeurs techniques,chefs de projet, architectes,responsables SI.Pré-requisConnaissances de base desarchitectures techniques.Prix 2018 : 1910 HTDates des sessionsBRUXELLESBig Data, état de l'art Big Data, BI, NoSQL, SGBD Big Data et NoSQLL'accroissement continuel des données numériques dans les entreprises et les organismes publics a conduità l'émergence du Big Data. Ce concept recouvre les questions de stockage et de conservation de vastesquantités de données, mais aussi celles liées au gisement potentiel de valeur que représentent ces massesde données. Ce séminaire présente les problèmes spécifiques du Big Data et les solutions techniquespotentielles, de la gestion des données aux différents types de traitement, qui témoignent d'une rupture parrapport aux moyens usuels d'analyse du fait des quantités traitées.OBJECTIFS PEDAGOGIQUESDécouvrir les principaux concepts du Big DataIdentifier les enjeux économiquesEvaluer les avantages et les inconvénients du Big DataComprendre les principaux problèmes et les solutions potentiellesIdentifier les principales méthodes et champs d'application du Big Data04 oct. 2018, 10 déc. 2018GENEVE04 oct. 2018, 10 déc. 2018LUXEMBOURG04 oct. 2018, 10 déc. 2018PARIS1) Introduction2) Big Data : traitements depuis l'acquisitionjusqu'au résultat3) Relations entre Cloud et Big Data4) Introduction à l'Open Data06 sep. 2018, 08 nov. 201810 déc. 20185) Matériel pour les architectures de stockage6) Protection des données7) Méthodes de traitement et champsd'application8) Cas d'usage à travers des exemples etconclusion1) IntroductionModalitésd’évaluationLes apports théoriques et lespanoramas des techniqueset outils ne nécessitentpas d’avoir recours à uneévaluation des acquis.- Les origines du Big Data : un monde de données numériques, l'e-santé, chronologie.- Une définition par les quatre V : la provenance des données.- Une rupture : changements de quantité, de qualité, d'habitudes.- La valeur de la donnée : un changement d'importance.- La donnée en tant que matière première.- Le quatrième paradigme de la découverte scientifique.2) Big Data : traitements depuis l'acquisition jusqu'au résultatCompétences duformateurLes experts qui animentla formation sont desspécialistes des matièresabordées. Ils ont étévalidés par nos équipespédagogiques tant sur leplan des connaissancesmétiers que sur celui de lapédagogie, et ce pour chaquecours qu’ils enseignent. Ilsont au minimum cinq à dixannées d’expérience dansleur domaine et occupentou ont occupé des postes àresponsabilité en entreprise.Moyenspédagogiques ettechniques Les moyens pédagogiqueset les méthodesd'enseignement utiliséssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigés des exercices pourles stages pratiques, étudesde cas ou présentation de casréels pour les séminaires deformation. A l'issue de chaque stage ouséminaire, ORSYS fournit aux- L'enchaînement des opérations. L'acquisition.- Le recueil des données : crawling, scraping.- La gestion de flux événementiel (Complex Event Processing, CEP).- L'indexation du flux entrant.- L'intégration avec les anciennes données.- La qualité des données : un cinquième V ?- Les différents types de traitement : recherche, apprentissage (machine learning, transactionnel, datamining).- D'autres modèles d'enchaînement : Amazon, e-Santé.- Un ou plusieurs gisements de données ? De Hadoop à l'in-memory.- De l'analyse de tonalité à la découverte de connaissances.3) Relations entre Cloud et Big Data- Le modèle d'architecture des Clouds publics et privés.- Les services XaaS.- Les objectifs et avantages des architectures Cloud.- Les infrastructures.- Les égalités et les différences entre Cloud et Big Data.- Les Clouds de stockage.- Classification, sécurité et confidentialité des données.- La structure comme critère de classification : non structurée, structurée, semi-structurée.- Classification selon le cycle de vie : données temporaires ou permanentes, archives actives.- Difficultés en matière de sécurité : augmentation des volumétries, la distribution.- Les solutions potentielles.4) Introduction à l'Open Data- La philosophie des données ouvertes et les objectifs.- La libération des données publiques.- Les difficultés de la mise en œuvre.- Les caractéristiques essentielles des données ouvertes.- Les domaines d'application. Les bénéfices escomptés.5) Matériel pour les architectures de stockage- Les serveurs, disques, réseau et l'usage des disques SSD, l'importance de l'infrastructure réseau.ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 3

participants un questionnaired'évaluation du cours quiest ensuite analysé par noséquipes pédagogiques. Une feuille d’émargementpar demi-journée de présenceest fournie en fin de formationainsi qu’une attestation de finde formation si le stagiaire abien assisté à la totalité de lasession.- Les architectures Cloud et les architectures plus traditionnelles.- Les avantages et les difficultés.- Le TCO. La consommation électrique : serveurs (IPNM), disques (MAID).- Le stockage objet : principe et avantages.- Le stockage objet par rapport aux stockages traditionnels NAS et SAN.- L'architecture logicielle.- Niveaux d'implantation de la gestion du stockage.- Le "Software Defined Storage".- Architecture centralisée (Hadoop File System).- L'architecture Peer-to-Peer et l'architecture mixte.- Les interfaces et connecteurs : S3, CDMI, FUSE, etc.- Avenir des autres stockages (NAS, SAN) par rapport au stockage objet.6) Protection des données- La conservation dans le temps face aux accroissements de volumétrie.- La sauvegarde, en ligne ou locale ?- L'archive traditionnelle et l'archive active.- Les liens avec la gestion de hiérarchie de stockage : avenir des bandes magnétiques.- La réplication multisites.- La dégradation des supports de stockage.7) Méthodes de traitement et champs d'application- Classification des méthodes d'analyse selon le volume des données et la puissance des traitements.- Hadoop : le modèle de traitement Map Reduce.- L'écosystème Hadoop : Hive, Pig. Les difficultés d'Hadoop.- OpenStack et le gestionnaire de données Ceph.- Le Complex Event Processing : un exemple ? Storm.- Du BI au Big Data.- Le décisionnel et le transactionnel renouvelés : les bases de données NoSQL.Typologie et exemples.- L'ingestion de données et l'indexation. Deux exemples : splunk et Logstash.- Les crawlers Open Source.- Recherche et analyse : Elasticsearch.- L'apprentissage : Mahout. In-memory.- Visualisation : temps réel ou non, sur le Cloud (Bime), comparaison QlikView, Tibco Spotfire, Tableau.- Une architecture générale du data mining via le Big Data.8) Cas d'usage à travers des exemples et conclusion- L'anticipation : besoins des utilisateurs dans les entreprises, maintenance des équipements.- La sécurité : des personnes, détection de fraude (postale, taxes), le réseau.- La recommandation. Analyses marketing et analyses d'impact.- Analyses de parcours. Distribution de contenu vidéo.- Big Data pour l'industrie automobile ? Pour l'industrie pétrolière ?- Faut-il se lancer dans un projet Big Data ?- Quel avenir pour les données ?- Gouvernance du stockage des données : rôle et recommandations, le Data Scientist, les compétences d'unprojet Big Data.ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 4

Cours de synthèse de 2jour(s)Réf : BAGBig Data, synthèse techniqueParticipantsCe cours de synthèse vous présentera les enjeux et les apports du Big Data ainsi que les technologies poursa mise en œuvre. Vous apprendrez à gérer un projet de gestion de données massives depuis l'installationd'une plateforme Big Data, tout en passant par la gestion, l'analyse et la visualisation des données.Dataminers, chargés d'étudesstatistiques, développeurs,chefs de projet, consultantsen informatique décisionnelle.Pré-requisConnaissances de basedes modèles relationnels,des statistiques et deslangages de programmation.Connaissances de base desconcepts de la BusinessIntelligence.Prix 2018 : 1770 HT Big Data, BI, NoSQL, SGBD Big Data et NoSQLOBJECTIFS PEDAGOGIQUESDécouvrir les concepts clés du Big DataComprendre l'écosystème technologique d'un projet Big DataEvaluer les techniques de gestion des flux de données massivesImplémenter des modèles d'analyses statistiques pour répondre aux besoins métiersDécouvrir les outils de Data Visualisation1) Comprendre les concepts clés et les enjeuxdu Big Data2) Technologies du Big Data3) Traitement des données Big DataDates des sessionsPARIS20 sep. 2018, 29 nov. 2018Modalitésd’évaluationL’objectif de cette formationétant essentiellement defournir une synthèse desméthodes et technologiesexistantes, il n’est pasnécessaire d’avoir recours àune évaluation des acquis.Compétences duformateurLes experts qui animentla formation sont desspécialistes des matièresabordées. Ils ont étévalidés par nos équipespédagogiques tant sur leplan des connaissancesmétiers que sur celui de lapédagogie, et ce pour chaquecours qu’ils enseignent. Ilsont au minimum cinq à dixannées d’expérience dansleur domaine et occupentou ont occupé des postes àresponsabilité en entreprise.Moyenspédagogiques ettechniques Les moyens pédagogiqueset les méthodesd'enseignement utiliséssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigés des exercices pourles stages pratiques, étudesde cas ou présentation de casréels pour les séminaires deformation. A l'issue de chaque stage ouséminaire, ORSYS fournit aux4) Méthodes d'analyse et traitements desdonnées pour le Big Data5) Data Visualisation, représenter des donnéesde façon visuelle6) ConclusionDémonstrationPrésenter la plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créerdes modèles d'analyse et dashboards.1) Comprendre les concepts clés et les enjeux du Big Data- Les origines du Big Data.- La valeur de la donnée : un changement d'importance.- La donnée en tant que matière première.- Les chiffres clés du marché dans le monde et en France.- Les enjeux du Big Data : ROI, organisation, confidentialité des données.DémonstrationPrésentation d'une architecture Big Data.2) Technologies du Big Data- Architecture et composants de la plateforme Hadoop 2.- Les modes de stockage (NoSQL, HDFS).- Fonctionnement de MapReduce et Yarn.- Principales distributions Hadoop : Hortonworks, Cloudera, MapR.- Les technologies émergentes : Spark, Storm, Machine Learning Azure.- Démarche d'installation d'une plateforme Hadoop.- Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview .).DémonstrationInstallation d'une plateforme Big Data complète.3) Traitement des données Big Data- Fonctionnement de Hadoop Distributed File System (HDFS).- Importer des données vers HDFS.- Traitement des données avec PIG.- Requêtes SQL avec HIVE.- Création de flux de données massives avec un ETL.DémonstrationImplémentation de flux de données massives.4) Méthodes d'analyse et traitements des données pour le Big Data- Les méthodes d'exploration.- Segmentation et classification.- Machine Learning, estimation et prédiction.- Le temps réel, l'IA.- L'implémentation des modèles.DémonstrationPrésentation de l'environnement Spark, Jupyter Notebook, R Notebook et Shiny. Mise en place d'analyses demachine-learning avec le langage R, Python et Scala.5) Data Visualisation, représenter des données de façon visuelleORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 5

participants un questionnaired'évaluation du cours quiest ensuite analysé par noséquipes pédagogiques. Une feuille d’émargementpar demi-journée de présenceest fournie en fin de formationainsi qu’une attestation de finde formation si le stagiaire abien assisté à la totalité de lasession.- Principales solutions du marché.- Aller au-delà des rapports statiques.- La Data Visualisation et l'art de raconter des chiffres de manière créative et ludique.- Mesurer l'e-réputation, la notoriété d'une marque, l'expérience et la satisfaction clients.DémonstrationPrésentation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.6) Conclusion- Les conditions du succès.- Synthèse des meilleures pratiques.- Bibliographie.ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 6

Séminaire de 2 jour(s)Réf : BMDParticipantsBig Data, Data Science, Machine Learning, leur impactdans l’entreprise Big Data, BI, NoSQL, SGBD Big Data et NoSQLDirigeants d'entreprise,directeurs financiers,responsables métier,responsables maîtrised'ouvrage, DSI, responsablesinformatiques, consultants,auditeurs, informaticiens.La révolution numérique est rendue possible par l'explosion du volume des données échangées au sein eten dehors des entreprises. Cette révolution a permis l'apparition de nombreux nouveaux usages et nousn'en sommes qu'au début. Sans entrer dans le détail de la technique ni des aspects architecturaux ou desmodèles de données, ce séminaire vous présentera une vision d'ensemble de l'impact que peuvent avoir leBig Data, la Data Science et le Machine Learning sur les nouveaux modèles d'entreprise.Pré-requisOBJECTIFS PEDAGOGIQUESAucune connaissanceparticulière.Découvrir les fondamentaux du Big Data, de la Data Science et du Machine LearningEvaluer en quoi les données prennent une position prédominante dans les nouveaux business modelsComprendre le rôle de la Data Science au sein de l'organisation et de la gouvernance de l'informationPrésenter les enjeux des usages que représentent le machine learning, le deep learning et les impactsorganisationnelsJustifier l'ouverture du SI vers l'extérieur, tant en collecte de données qu'en fourniturePrix 2018 : 1910 HTDates des sessionsPARIS24 sep. 2018, 13 déc. 2018Modalitésd’évaluationLes apports théoriques et lespanoramas des techniqueset outils ne nécessitentpas d’avoir recours à uneévaluation des acquis.Compétences duformateurLes experts qui animentla formation sont desspécialistes des matièresabordées. Ils ont étévalidés par nos équipespédagogiques tant sur leplan des connaissancesmétiers que sur celui de lapédagogie, et ce pour chaquecours qu’ils enseignent. Ilsont au minimum cinq à dixannées d’expérience dansleur domaine et occupentou ont occupé des postes àresponsabilité en entreprise.Moyenspédagogiques ettechniques Les moyens pédagogiqueset les méthodesd'enseignement utiliséssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigés des exercices pourles stages pratiques, étudesde cas ou présentation de casréels pour les séminaires deformation. A l'issue de chaque stage ouséminaire, ORSYS fournit auxparticipants un questionnaired'évaluation du cours quiest ensuite analysé par noséquipes pédagogiques.1) Historique et contexte de l'explosion desusages autour des données2) Le Big Data, la Data Science, la MachineLearning, l'IA3) La gestion du patrimoine informationnel et lepilotage de la valeur4) Les acteurs du Big Data et les enjeuxorganisationnels associés5) Le Big Data étendu6) Les notions pour aller plus loin et quelquespistes pour se lancer1) Historique et contexte de l'explosion des usages autour des données- La révolution numérique est en route . poussée par un tsunami informationnel !- Quelles sont les grandes briques fonctionnelles et techniques de la gestion du patrimoine informationnel ?- Qu'est ce que le Big Data ? Définition et périmètre général.- Un peu d'histoire sur les origines et l'explosion du Big Data.- Le Big Data n'est pas une mode et s'inscrit dans la révolution numérique comme le carburant del'innovation.- Le Big Data : les grands usages actuels.- Quelques grandes notions technologiques à retenir et comment surnager parmi tous ces acronymestechniques.- Quelle cohabitation entre les différentes générations de système de gestion des données ?- Quel futur pour toutes ces solutions et usages ? Quel est le niveau de maturité à date ?EchangesRéflexion collective sur la révolution numérique.2) Le Big Data, la Data Science, la Machine Learning, l'IA- Créer et améliorer les facultés de l'entreprise grâce aux Big Data.- Les grandes briques applicatives au service du Big Data dans l'entreprise.- De l'analyse statistique à la Data Science : quels profils, pour quels bénéfices ?- Les principales déclinaisons de l'Intelligence Artificielle.- L'Intelligence Artificielle dans l'analyse prédictive.- Le Machine Learning ou la capacité d'apprentissage par la machine.- Apprendre par le traitement de masse de l'information recueillie : le Deep Learning.- L'Intelligence Artificielle, le Machine Learning et le Deep Learning : quels enjeux pour nos sociétés ?EchangesRéflexion collective sur l'évolution de le Big Data, de la Data Science, du Machine Learning et l'IntelligenceArtificielle.3) La gestion du patrimoine informationnel et le pilotage de la valeur- La place des données dans la révolution numérique.- La place de la donnée dans les modèles d'entreprise disruptifs.- La valeur des données au coeur des enjeux métiers.- Peut-on connaître et piloter la valeur de son patrimoine informationnel ?- Quel est le risque d'infobésité ? Comment s'en prémunir ?- Les opportunités de monétisation de l'information.- Comment installer une culture de la donnée dans l'entreprise ?- Le poids et le coût de la qualité des données du patrimoine géré par l'entreprise.- L'apport de valeur par les données touche tous les métiers de nos clients.Etude de casEtude de cas sur l'analyse de la valeur de la donnée.ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 7

Une feuille d’émargementpar demi-journée de présenceest fournie en fin de formationainsi qu’une attestation de finde formation si le stagiaire abien assisté à la totalité de lasession.4) Les acteurs du Big Data et les enjeux organisationnels associés- Organisation, rôles et gouvernance : les nouveaux modèles à l'heure du Big Data.- Pourquoi les silos organisationnels sont un frein majeur à l'exploitation des données et comment yremédier ?- La Data Science : adapter les profils de statisticiens aux nouveaux enjeux.- Les spécialistes des nouveaux domaines et leurs méthodes de travail.- Les thématiques de mise en œuvre de la gouvernance des données.- Les acteurs de la gouvernance de la donnée.- Les acteurs en charge de la qualité de la donnée.- Quelles sont les grandes tendances règlementaires autour de la gestion des données et comment lesaborder ?DémonstrationDémonstration de l'importance de la gouvernance des données.5) Le Big Data étendu- La place de l'entreprise dans son écosystème de données.- Les données à la frontière de l'entreprise (DMP).- Les données fournies par des partenaires : réseaux sociaux.- L'Internet des Objets (IoT) ou comment rendre son entreprise sensible aux nouveaux usages.- L'Open Data et ses apports dans l'analyse de données : nouvelles données, enrichissement, croisement dedonnées.- L'émergence des Chatbots ou l'automatisation de fonctions d'interface clients : quels impacts dans nosorganisations ?- L'expérience client augmentée, levier de la transformation digitale des entreprises.- La fourniture de données comme nouvelle source de revenus.- Les données, carburant de l'innovation métier.DémonstrationDémonstrations sur l'innovation basée sur le Big Data, la Data Science et le Machine Learning.6) Les notions pour aller plus loin et quelques pistes pour se lancer- Quels sont les risques à ne pas prendre en compte la gestion du patrimoine informationnel ?- Les grandes tendances autour de la Data pour les trois années à venir.- Les solutions technologiques : Big Data et Machine Learning.- Mode d'emploi pour lancer une initiative Big Data.- Les techniques du Big Data : tour d'horizon.- Les métiers, fonctions et rôles autour de la donnée : la synthèse et les différents niveaux de mise en œuvre.- Pourquoi les entreprises se lancent-elles dans le Big Data ?ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 8

Stage pratique de 3 jour(s)Réf : BDTParticipantsResponsables SI, architectesIT, chefs de projet et toutepersonne souhaitant acquérirdes bases sur le Big Data.Pré-requisConnaissances de base desarchitectures techniques.Big Data Foundation, certification Big Data, BI, NoSQL, SGBD Big Data et NoSQLL'explosion quantitative des données numériques a contraint à trouver de nouvelles façons d'analyser lemonde, et cela a abouti à l'émergence du Big Data. Cette formation apportera aux participants les bases duBig Data et du Data Mining et les préparera au passage de la certification Big Data Foundation de l'EXIN.OBJECTIFS PEDAGOGIQUESDécouvrir les fondamentaux du Big DataComprendre ce qu'est le Data MiningEvaluer les technologies émergentes du Big DataPasser la certification Big Data FoundationPrix 2018 : 2570 HTDates des sessionsPARIS17 sep. 2018, 03 déc. 2018Modalitésd’évaluationPour les certifications, desexamens blancs permettentde mesurer le degré depréparation. Pour les cyclescertifiants, une journéed’examen est mise en place.Compétences duformateurLes experts qui animentla formation sont desspécialistes des matièresabordées. Ils ont étévalidés par nos équipespédagogiques tant sur leplan des connaissancesmétiers que sur celui de lapédagogie, et ce pour chaquecours qu’ils enseignent. Ilsont au minimum cinq à dixannées d’expérience dansleur domaine et occupentou ont occupé des postes àresponsabilité en entreprise.Moyenspédagogiques ettechniques Les moyens pédagogiqueset les méthodesd'enseignement utiliséssont principalement : aidesaudiovisuelles, documentationet support de cours, exercicespratiques d'application etcorrigés des exercices pourles stages pratiques, étudesde cas ou présentation de casréels pour les séminaires deformation. A l'issue de chaque stage ouséminaire, ORSYS fournit auxparticipants un questionnaired'évaluation du cours quiest ensuite analysé par noséquipes pédagogiques. Une feuille d’émargementpar demi-journée de présence1) Les fondamentaux du Big Data2) Mise en pratique des approches Big Data,synthèse3) Les sources du Big Data4) Les données et l'information5) Data Mining6) Outil : Hadoop7) Outil : MongoDB8) Examen "Big Data Foundation" de l'EXINCertificationLe passage de l'examen s'effectue le dernier jour, en ligne et en anglais. Cela consiste en un QCM d'uneheure, comportant 40 questions. Un score minimum de 65% est requis pour réussir l'examen.1) Les fondamentaux du Big Data- L'histoire et les principaux bénéfices du Big Data.- Les trois dimensions du Big Data (volume, variété, vélocité).- Les technologies Hadoop et MongoDB.- Les limites du Big Data.- Les grands acteurs du marché. La vie privée.2) Mise en pratique des approches Big Data, synthèse- La fraude bancaire.- La relation client et le marketing.- L'internet des objets.- Le "People Analytics".3) Les sources du Big Data- Les principaux types de données.- Les données de l'entreprise (Oracle, SAP, Microsoft, Data Warhouses, données non-structurées).- Les liens avec les réseaux sociaux (Facebook, Twitter, autres).- Les données publiques (Opendata, économiques, financières, comportementales.).4) Les données et l'information- La notion de Datalake.- Collecter, préparer et gérer les données.- La modélisation de données.- La Data Sécurité, la Data Gouvernance, la Data Scientist.- La Metadata.5) Data Mining- Qu'est-ce que le Data Mining ?- Les différents types (classification, association.).- Quelques algorithmes essentiels (régression linéaires, régression polynomiale).- Notion de séries temporelles.- La Machine Learning et l'Intelligence Artificielle (IA).- Les outils (Weka, KNIME, R).- Principales application : Analyse sentiment sur Twitter, analyse des log réseau.6) Outil : Hadoop- Présentation de Hadoop (les principaux composants).- Architecture d'Hadoop. Installation et configuration.- MapReduce (Parallelisation automatique des programmes Hadoop).- DataProcessing avec Hadoop (Analyse de sentiment, analyse des logs).7) Outil : MongoDBORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 9

est fournie en fin de formationainsi qu’une attestation de finde formation si le stagiaire abien assisté à la totalité de lasession.- Présentation de MongoDB (fonctionnalités et concepts).- Réplication et Sharding.- Ecosystèmes (langages, drivers, outils, intégration avec Hadoop).- Installation et configuration.- Base de données de documents.- Modèle de données de documents (Analyse de sentiment, analyse des logs).8) Examen "Big Data Foundation" de l'EXIN- Examen blanc avec correction commentée.- Passage de l'examen "Big Data Foundation".ORSYS, La Grande Arche, Paroi Nord, 92044 Paris La Défense cedex. Tél : 33 (0)1 49 07 73 73. Fax : 33(0)1 49 07 73 78page 10

Stage pratique de 5 jour(s)Réf : BIDParticipantsDataminers, chargés d'étudesstatistiques, développeurs,chefs de projet, consultantsen informatique décisionnelle.Pré-requisConnaissances de basedes modèles relationnels,des statistiques et deslangages de programmation.Connaissances de base desconcepts de la BusinessIntelligence.Prix 2018 : 3030 HTDates des sessionsAIXBig Data, méthodes et solutions pratiques pour l'analysedes données Big Data, BI, NoSQL, SGBD Big Data et NoSQLCe stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pourle mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et nonstructurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.OBJECTIFS PEDAGOGIQUESComprendre les concepts et l'apport du Big Data par rapport aux enjeux métiersComprendre l'écosys

- Visualisation : temps réel ou non, sur le Cloud (Bime), comparaison QlikView, Tibco Spotfire, Tableau. - Une architecture générale du data mining via le Big Data. 8) Cas d'usage à travers des exemples et conclusion - L'anticipation : besoins des utilisateurs dans les entreprises, maintenance des équipements.