Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze
STATISTICA PER L'ECONOMIA E L'IMPRESA
Insegnamento
METODI STATISTICI PER BIG DATA
SCP4063754, A.A. 2016/17

Informazioni valide per gli studenti immatricolati nell'A.A. 2014/15

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea in
STATISTICA PER L'ECONOMIA E L'IMPRESA
SC2095, ordinamento 2014/15, A.A. 2016/17
N0
porta questa
pagina con te
Crediti formativi 9.0
Tipo di valutazione Voto
Denominazione inglese STATISTICAL METHODS FOR BIG DATA
Dipartimento di riferimento Dipartimento di Scienze Statistiche
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile BRUNO SCARPA SECS-S/01
Altri docenti ANTONIO CANALE SECS-S/01

Mutuante
Codice Insegnamento Responsabile Corso di studio
SCP4063754 METODI STATISTICI PER BIG DATA BRUNO SCARPA SC2094

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
AFFINE/INTEGRATIVA Attività formative affini o integrative SECS-S/01 9.0

Organizzazione dell'insegnamento
Periodo di erogazione Secondo semestre
Anno di corso III Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LABORATORIO 4.0 30 70.0
LEZIONE 5.0 34 91.0

Calendario
Inizio attività didattiche 27/02/2017
Fine attività didattiche 09/06/2017
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2014

Commissioni d'esame
Commissione Dal Al Membri
3 Commissione a.a.2018/19 01/10/2018 30/09/2019 SCARPA BRUNO (Presidente)
CANALE ANTONIO (Membro Effettivo)
FINOS LIVIO (Membro Effettivo)
MENARDI GIOVANNA (Membro Effettivo)
2 Commissione a.a.2017/18 01/10/2017 30/09/2018 SCARPA BRUNO (Presidente)
CANALE ANTONIO (Membro Effettivo)
FINOS LIVIO (Membro Effettivo)
MENARDI GIOVANNA (Membro Effettivo)

Syllabus
Prerequisiti: Algebra Lineare, Sistemi di elaborazione, Statistica 2, Modelli Statistici 1, Modelli
Statistici 2, Statistica Computazionale
Conoscenze e abilita' da acquisire: I metodi di analisi dei dati in statistica e machine learning giocano ormai un ruolo centrale nelle
realtà aziendali, industriali e scientifiche. La crescita del web e lo sviluppo di strumenti tecnologici
che raccolgono e salvano enormi quantità di dati e informazioni hanno portato ad un rapido
incremento nella dimensione dei dati e nella complessità delle analisi e della modellazione
statistica. Sorgono inoltre nuove forme di dati non direttamente riportabili alla classica matrice dei
dati statistica, ma a strutture più complesse come funzioni, grafi e reti. Queste moderne ed
emergenti applicazioni in ambito aziendale, industriale e tecnologico spiegano la necessità di
introdurre modelli statistici e algoritmi (scalabili, paralleli, ricorsivi e dinamici) che possano essere
adattati a queste grandi masse di dati. Il corso si propone di fornire, a livello di laurea triennale, gli
strumenti statistici di base per affrontare questi problemi, ponendosi in continuità rispetto al corso
di Analisi di dati multidimensionali. In particolare, il nuovo corso si propone di approfondire alcuni
argomenti (quali quelli legati ai metodi di riduzione della dimensionalità, analisi dei fattori, metodi
di raggruppamento), caratterizzandone l'applicazione al contesto dei "Big Data", introducendone
alcuni completamente nuovi, quali quelli legati all'analisi di dati funzionali, di reti sociali e
all'analisi di un numero elevato di variabili rispetto ad un numero esiguo di osservazioni.
Modalita' di esame: prova scritta e/o prova pratica
Criteri di valutazione: Correttezza e qualità delle prove d'esame.
Contenuti: - Metodi di visualizzazione dei dati e di big data.
- Metodi di riduzione della dimensionalità (independent component analysis, principal curves,
principal surfaces, projection pursuit)
- Metodi di estrazione di fattori: esempi di modelli di analisi fattoriale confermativa (e.g. Partial
Least Squares)
- Metodi di raggruppamento basati su modelli parametrici e non parametrici
- Metodi di analisi in presenza di un numero elevato di variabili e un esiguo numero di
osservazioni: metodi di stima penalizzata, lasso e lars e relative modifiche. Altri algoritmi
efficienti.
- Introduzione all'analisi dei dati funzionali
- Metodi di analisi di dati raccolti da reti (e reti sociali): struttura dei dati, modelli grafici e
semplici modelli statistici (e.g. logistico, di Erdos-Renyi, ERGM) ; modelli per dati da social
networks (e.g. Hopkins and King).
- Aspetti di statistica computazionale: algoritmi statistici di calcolo parallelo, ricorsivo e
dinamico. Stime ricorsive per modelli lineari e modelli lineari dinamici (algoritmo per stima
ricorsiva, filtro di Kalman).
Attivita' di apprendimento previste e metodologie di insegnamento: Lezioni frontali. Esercitazioni in laboratorio
Eventuali indicazioni sui materiali di studio: Materiale didattico disponibile sulla pagina web del corso. Lo strumento di calcolo primario
adottato per questo corso è l'ambiente di programmazione R; questo può essere prelevato, assieme
alla relativa documentazione, da una postazione CRAN.
Testi di riferimento:
  • Scarpa, B., Materiale didattico via web per l'insegnamento di Big Data. --: --, --.