F I Ş A D I S C I P L I N E I - Facultatea De Litere și Științe

Transcription

F I Ş A D I S C I P L I N E I 1)1. Date despre program1.1.1.2.1.3.1.4.1.5.1.6.Universitatea Petrol-Gaze din PloieştiLitere si StiinţeInformatică, Tehnologia Informaţiei, Matematică, FizicăInformaticăMasterTehnologii avansate pentru prelucrarea informaţieiInstituţia de învăţământ superiorFacultateaDepartamentulDomeniul de studii universitareCiclul de studii universitareProgramul de studii universitare2. Date despre disciplină2.1. Denumirea disciplineiTehnici avansate de data mining2.2. Titularul activităţilor de cursConf.dr. mat. Marinoiu Cristian2.3. Titularul activităţilor seminar/laboratorLector dr. Tudorică Daniela2.4. Titularul activităţii proiect2.5. Anul de studiuII2.6. Semestrul*32.7. Tipul de evaluareExamen2.8. Categoria formativă** / regimul*** disciplinei DS/O*numărul semestrului este conform planului de învăţământ;**DF - Discipline fundamentale; DD - discipline de domeniu; DS - discipline de specialitate; DC - discipline complementare, DA disciplina de aprofundare, DSI- disciplina de sinteza.***obligatorie O; opţională A; facultativă L3. Timpul total estimat (ore pe semestru al activităţilor didactice)3.1. Număr de ore pe săptămână3.5. Total ore din planul de învăţământ342din care: 3.2. cursdin care: 3.6. curs2283.3. Seminar/laborator3.7. Seminar/laborator1143.4. Proiect3.8. Proiect3.9. Distribuţia fondului de timpStudiu după manual, suport de curs, bibliografie şi notiţeDocumentare suplimentară în bibliotecă, pe platformele electronice de specialitate şi pe terenPregătire seminarii/laboratoare, teme, referate, portofolii şi eseuriTutoriatExaminăriAlte activităţi3.10 Total ore studiu individual1333.11. Total ore pe semestru423.12. Numărul de credite74. Precondiţii (acolo unde este cazul)4.1. de curriculum4.2. de competenţe Analiza datelor Abilităţi de programare, de calculul probabilităţilor şi de calcul statisticAdaptare după Ordinul Ministrului educaţiei, cercetării, tineretului şi sportului nr. 5 703/2011 privind implementarea Coduluinaţional al calificărilor din învăţământul superior, publicat în Monitorul Oficial al României, partea I, nr.880 bis / 13.XII.20111)F 021.06/Ed.6Document de uz intern-ore304442143-

5. Condiţii (acolo unde este cazul)5.1. de desfăşurare a cursului Sală cu dotare clasică5.2. de desfăşurare aseminarului/laboratorului Sală cu calculatoare dotate cu software ale6. Competenţe specifice acumulateC1.2 Utilizarea de teorii, modele conceptuale şi instrumente specifice pentruexplicarea structurii şi funcţionalităţii diverselor tipuri de sisteme software şi aplicaţiiinformatice complexe de procesare avansată a informaţieiC1.4 Alegerea criteriilor, metodelor şi tehnicilor de evaluare a calitǎţii, performanţelorşi limitărilor diverselor tipuri de sisteme software şi aplicaţii informatice complexe deprocesare avansată a informaţieiC6.4 Evaluarea comparativǎ şi analiza critică a soluţiilor de abordare a unor probleme CT1. Aplicarea regulilor de muncă organizată şi eficientă, a unor atitudiniresponsabile faţă de domeniile didactic, ştiinţific şi profesional, în vedereavalorificării creative a propriului potenţial, cu respectarea principiilor şi normelor deetică profesională7. Obiectivele disciplinei (reieşind din grila competenţelor specifice acumulate)7.1. Obiectivul general al disciplinei7.2. Obiectivele specificeObiectivul principal al disciplinei constă în însuşirea de cătrestudenţi a principalelor tehnici de data miningDupă parcurgerea disciplinei studenţii vor putea să: descrie tehnicile de data mining predate utilizeze un software care permite aplicarea tehnicilorde data mining utilizeze tehnici de data mining şi să interpretezerezultatele obţinute8. Conţinuturi8.1. Curs1. Modele KDP (Knowledge DiscoveryProcess). Forma standard de prezentare adatelor în Data Mining2. Tipuri de învăţare automată. Scale demăsurători. Pregătirea datelor pentruaplicarea tehnicilor de Data Mining3.Funcţie de cost, risc, risc empiric.F 021.06/Ed.6Document de uz internNr.ore2Metode de predareExpunere, studii de caz,conversație, dezbatere2Expunere, studii de caz,conversație, dezbatere2Expunere, studii de caz,Observaţii

Modele de regresie şi de clasificare,Prezentarea modelului de regresie liniară4 Rezolvarea modelului de regresieliniară, ,5.Consideraţii geometrice asupramodelului de regresie liniară. Overfitting,underfitting, compromisul deplasare- varianţă6.Regresia regularizată ( Ridge, LASSO,ElasticNet).7. Algoritmi de învăţare supervizată pentruclasificare (Bayes, Naïve Bayes, Analizadiscriminantă lineară-LDA)8. Algoritmi de învăţare supervizată pentruclasificare (Regresia logistică, KNN)conversație, dezbatere2Expunere, studii de caz,conversație, dezbatere2Expunere, studii de caz,conversație, dezbatere2Expunere, studii de caz,conversație, dezbatereExpunere, studii de caz,conversație, dezbatere229. Arbori de decizie. Algoritmul TDIDT210. Utilizarea entropiei pentru selecţiaatributului pentru divizare. AlgoritmulTDIDT pentru date continue şi neadecvate11. Clusteri neierarhici212. Clusteri ierarhici213. Metode şi indicatori pentru evaluarea2performanţelor modelelor de regresie14. Metode şi indicatori pentru evaluareaperformanţelor modelelor de clasificare22Expunere, studii de caz,conversație, dezbatereExpunere, studii de caz,conversație, dezbatereExpunere, studii de caz,conversație, dezbatereExpunere, studii de caz,conversație, dezbatereExpunere, studii de caz,conversație, dezbatereExpunere, studii de caz,conversație, dezbatereExpunere, studii de caz,conversație, dezbatereBibliografie1.Cristian Marinoiu, Introducere în Învăţarea Automată,, Editura Universităţii Petrol-Gaze din Ploieşti, 20192. Trevor Hastie, Robert Tibshirani, Jerome Friedman, The elements of Statistical Learning,SpringerVerlag, New York, 20013. Sergios Theodoridis, Konstantinos Koutroumbas,Pattern recognition, Elsevier Inc., 20094. Max Bramer, Principles of Data Mining, Springer Verlag, London Limited 20075.Christopher Bishop, Pattern recognition and Machine Learning, Springer Science Business Media, 20068.2. Seminar / laboratorElemente de bază privind operareaîntr-un pachet de programe specializatNr. oreMetode de predare2Expunere, studii de caz,conversație, dezbatere:aplicaţiipe calculatorAplicatii ale modelelor de regresie liniarăsimplă şi multiplă2Expunere, studii de caz,conversație, dezbatere:aplicaţiipe calculatorAplicatii ale modelelor de regresieregularizate (( Ridge, LASSO, ElasticNet)2Expunere, studii de caz,conversație, dezbatere:aplicaţiipe calculatorF 021.06/Ed.6Document de uz internObservaţii

Utilizarea clasificatorilor LDA (Analiza4discriminantă lineară), Regresia logistică,Expunere, studii de caz,conversație, dezbatere:aplicaţiiNaive Bayes şi K Nearest Neighbours(KNN) în aplicaţiiAplicatii ale arborilor de deciziepe calculator2Expunere, studii de caz,conversație, dezbatere:aplicaţiiAplicaţii ale metodelor de clusterizare2Expunere, studii de caz,conversație, dezbatere:aplicaţiipe calculatorpe calculatorBibliografie1. Trevor Hastie, Robert Tibshirani, Jerome Friedman, The elements of Statistical Learning,SpringerVerlag, New York, 20012. Sergios Theodoridis, Konstantinos Koutroumbas,Pattern recognition, Elsevier Inc., 20093. Max Bramer, Principles of Data Mining, Springer Verlag, London Limited 20074.Christopher Bishop, Pattern recognition and Machine Learning, Springer Science Business Media, 20065. Documentație R: https://cran.r-project.org/manuals.html6. Graham Williams, Rattle: A Data Mining GUI for R, The R Journal, Dec. 20097. Graham Williams, Data Mining with Rattle and R, Togaware Series, 20083. Coroborarea conţinuturilor disciplinei cu aşteptările reprezentanţilorcomunităţii epistemice, asociaţilor profesionale şi angajatori reprezentativi dindomeniul aferent programuluiTehnicile de data mining reprezintă o direcţie relativ nouă în Informatică. Sprijinte puternic perezultatele mai vechi sau mai noi din domeniile statisticii matematice şi ale inteligenţei artificialeaceste tehnici sunt utilizate din ce în ce mai mult în lucrări de cercetare interdisciplinară datorităpotenţialului inovativ pe care- l oferă: extragerea cunoştinţelor din uriaşul volum de dateacumulat de-a lungul timpului nu poate fi imaginată astăzi în afara utilizării acestor instrumente.La ora actuală meseria de „miner în date” este practicată de diverşi specialişti (matematicieni,informaticieni, ingineri, economişti, medici, psihologi,geneticieni etc.) care au un minim decunoştinţe în domeniu şi care sunt preocupaţi preocupaţi în valorificarea informaţiilor acumulateîn domeniul lor de activitate. Un statut bine conturat al specialistului în data mining este pe calede a se definitiva ( vezi, de exemplu nouncement sau http://www.allanalytics.com/author.asp?section id 2587&doc id 27133510. EvaluareTip activitate10.4. Curs10.5. Seminar/laborator/10.1. Criterii de evaluare10.2. Metode de evaluareCalitatea prezentăriisubiectului şi aExaminare oralărăspunsurilor laexaminarea finalăCalitateaactivităţii Intrebari privitoare la modul deF 021.06/Ed.6Document de uz intern10.3. Ponderedin nota finală50%10%

desfăşurate în cadrul rezolvare aproblemelorlaboratoruluipropuse in cadrul laboratoruluiCalitatea răspunsurilor la Teste de control pe parcursul20%testele de controlsemestruluiCalitateaproiectului Prezentarea proiectului l pe20%elaboratîncadrul calculatorlaboratorului10.6. Standard minim de performanţăStudentul trebuie să descrie corect metodele regresie şi de clasificare prezentate la curs ştie să utilizeze pachetul de programe prezentat la laborator pentru rezolvarea problemelor carepot fi soluţionate utilizând modelele anterioare descrie corect cel puţin un indicator sau cel puţin una dintre metode pentru evaluarea performanţelormodelelor de regresie sau de clasificare prezentate la cursDatacompletăriiSemnătura titularului decurs9.09.2020Conf. dr.Marinoiu CristianData avizării în departamentSemnătura titularuluide r dr.Tudorică DanielaSemnătura directorului de departamentConf. dr. Gabriela MoiseF 021.06/Ed.6Document de uz internde

7. Graham Williams, Data Mining with Rattle and R, Togaware Series, 2008 3. Coroborarea conţinuturilor disciplinei cu aşteptările reprezentanţilor comunităţii epistemice, asociaţilor profesionale şi angajatori reprezentativi din domeniul aferent programului Tehnicile de data mining reprezintă o direcţie relativ nouă în Informatică.