Insegnamento
DATA MINING
INN1029617, A.A. 2013/14

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
INGEGNERIA INFORMATICA
IN0521, ordinamento 2009/10, A.A. 2013/14
1089219
Crediti formativi 6.0
Denominazione inglese DATA MINING
Dipartimento di riferimento Dipartimento di Ingegneria dell'Informazione (DEI)
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA

Docenti
Responsabile ANDREA ALBERTO PIETRACAPRINA INF/01

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
AFFINE/INTEGRATIVA Attività formative affini o integrative INF/01 2.0
CARATTERIZZANTE Ingegneria informatica ING-INF/05 4.0

Modalità di erogazione
Periodo di erogazione Secondo semestre
Anno di corso I Anno
Modalità di erogazione frontale

Organizzazione della didattica
Tipo ore Crediti Ore di
Corso
Ore Studio
Individuale
Turni
LEZIONE 6.0 48 102.0 Nessun turno

Calendario
Inizio attività didattiche 03/03/2014
Fine attività didattiche 14/06/2014

Commissioni d'esame
Commissione Dal Al Membri
7 A.A. 2016/2017 01/10/2016 15/03/2018 PIETRACAPRINA ANDREA ALBERTO (Presidente)
PUCCI GEPPINO (Membro Effettivo)
FANTOZZI CARLO (Supplente)
VANDIN FABIO (Supplente)
6 A.A. 2014/2015 01/10/2014 30/09/2016 FANTOZZI CARLO (Presidente)
PIETRACAPRINA ANDREA ALBERTO (Membro Effettivo)
5 A.A. 2014/2015 01/10/2014 15/03/2016 FANTOZZI CARLO (Presidente)
PIETRACAPRINA ANDREA ALBERTO (Membro Effettivo)
4 A.A. 2014/2015 01/10/2014 15/03/2016 PIETRACAPRINA ANDREA ALBERTO (Presidente)
PUCCI GEPPINO (Membro Effettivo)
AGOSTI MARISTELLA (Supplente)
BILARDI GIANFRANCO (Supplente)
COMIN MATTEO (Supplente)
DE POLI GIOVANNI (Supplente)
FANTOZZI CARLO (Supplente)
FERRARI CARLO (Supplente)
PIZZI CINZIA (Supplente)
SATTA GIORGIO (Supplente)
01/10/2013 15/03/2015 PIETRACAPRINA ANDREA ALBERTO (Presidente)
PUCCI GEPPINO (Membro Effettivo)
BILARDI GIANFRANCO (Supplente)
DALPASSO MARCELLO (Supplente)
DE POLI GIOVANNI (Supplente)
FANTOZZI CARLO (Supplente)
FERRARI CARLO (Supplente)
2 2012 01/10/2012 15/03/2014 PIETRACAPRINA ANDREA ALBERTO (Presidente)
PUCCI GEPPINO (Membro Effettivo)
BILARDI GIANFRANCO (Supplente)
FANTOZZI CARLO (Supplente)

Syllabus
Prerequisiti: E' richiesta competenza nello sviluppo e analisi di algoritmi e strutture dati, e la conoscenza delle nozioni fondamentali di calcolo delle probabilità e statistica
Conoscenze e abilita' da acquisire: Il corso introduce lo studente alle principali tecniche per la estrazione efficiente ed efficace di informazioni utili e interessanti da insiemi di dati (potenzialmente grandi). In particolare verranno studiate tecniche di association analysis e learning.
Modalita' di esame: Prova scritta e progetto obbligatori. Prova orale facoltativa o a
discrezione del docente.
Criteri di valutazione: La valutazione finale è ottenuta dalla seguente formula

(voto progeto)*0.3+(voto scritto*0.7)

L'eventuale orale comporta una variazione al voto quantificata dal docente
Contenuti: Introduzione al fenomeno Big Data.

Datawarehousing: distinzione tra OLTP, OLAP e Data Mining; modelli MOLAP e ROLAP; operatori OLAP.

Association Analysis: itemset frequenti, regole associative, sequantial pattern.

Classification: decision tree; classificatori basati su regole; classificatori Naive Bayes; Support Vector Machine; tecniche di valutazione (holdout, random subsampling, cross validation, bootstrap); intervalli di confidenza; problemi di class imbalance; curve ROC e AUC.
Attivita' di apprendimento previste e metodologie di insegnamento: Il corso si articola in lezioni frontali e lo svolgimento di un progetto individuale o per piccoli gruppi.

Il diario delle lezioni, il materiale aggiuntivo, le modalità d'esame dettagliate, e raccolte di esercizi svolti, sono rese disponibili sul sito web accessibile dalla pagina MOODLE del corso
Eventuali indicazioni sui materiali di studio: Alcune dispense a integrazione e completamento del libro di testo sono distribuite e messe a disposizione sul sito web del corso.
Testi di riferimento:
  • P.N. Tan, M. Steinbach, V. Kumar, Introduction to Data Mining. --: Addison Wesley, 2006. Cerca nel catalogo