Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze
SCIENZE STATISTICHE
Insegnamento
METODI INFORMATICI PER LA STATISTICA E IL DATA SCIENCE
SCP7081820, A.A. 2019/20

Informazioni valide per gli studenti immatricolati nell'A.A. 2019/20

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
SCIENZE STATISTICHE
SS1736, ordinamento 2014/15, A.A. 2019/20
N0
porta questa
pagina con te
Crediti formativi 9.0
Tipo di valutazione Voto
Denominazione inglese INFORMATIC METHODS FOR STATISTICS AND DATA SCIENCE
Sito della struttura didattica http://www.stat.unipd.it/studiare/ammissione-laurea-magistrale
Dipartimento di riferimento Dipartimento di Scienze Statistiche
Sito E-Learning https://elearning.unipd.it/stat/course/view.php?idnumber=2019-SS1736-000ZZ-2019-SCP7081820-N0
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile EMANUELE DI BUCCIO ING-INF/05

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
AFFINE/INTEGRATIVA Attività formative affini o integrative ING-INF/05 9.0

Organizzazione dell'insegnamento
Periodo di erogazione Secondo semestre
Anno di corso I Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LEZIONE 9.0 64 161.0

Calendario
Inizio attività didattiche 02/03/2020
Fine attività didattiche 12/06/2020
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2014

Commissioni d'esame
Nessuna commissione d'esame definita

Syllabus
Prerequisiti: I prerequisiti sono relativamente semplici, ma necessari: elementi di strutture di dati (variabile, file, vettore, matrice), algoritmi elementari, sistemi di elaborazione, e sistemi di gestione delle basi di dati. La conoscenza di un linguaggio di programmazione e' utile, ma non strettamente necessaria. La conoscenza di R e' sconsigliata.
Conoscenze e abilita' da acquisire: S’intende fornire le conoscenze concrete di metodi e strumenti informatici affinché uno studente possegga maggiore competenza in Statistica di un informatico e maggiore competenza in Informatica di uno statistico. Particolare enfasi sarà posta su programmazione e gestione dei dati e sul superamento del modo di scrivere software indotto da linguaggi come R e da pacchetti di software preconfezionato.
Modalita' di esame: Prova pratica ed esame orale
Criteri di valutazione: Si valuterà la comprensione delle problematiche e la capacità di trovare e di progettare soluzioni automatizzate per l'organizzazione, la gestione e l'analisi di dati allo scopo di svolgere i compiti illustrati nei contenuti e previsti dal progetto della prova orale.
Contenuti: 1. Introduzione a Python: ambiente, costrutti, primi esempi.
2. Raccolta, organizzazione e gestione di grandi masse di dati: pattern matching, parsing (XML, CSV).
3. Strutture di dati fondamentali: liste, hash, grafi, alberi.
4. Algoritmi fondamentali: ricorsione, ricerca, ordinamento.
5. Architetture distribuite con MapReduce.
6. Rappresentazione e reperimento.
7. Reti, link e click-through: WWW, Link Analysis, HITS, Pagerank.
8. Decomposizione e riduzione della dimensionalita'.
9. Insiemi frequenti.
Attivita' di apprendimento previste e metodologie di insegnamento: I contenuti saranno trattati in forma prevalentemente laboratoriale mediante lo sviluppo di programmi e l’utilizzo di librerie software in Python.
Gli elementi metodologici saranno introdotti allo scopo di conoscere le problematiche sottostanti, di progettare e realizzare progetti, e di utilizzare gli strumenti in modo consapevole.
Eventuali indicazioni sui materiali di studio: Materiale didattico sarà distribuito durante le lezioni in aggiunta ai testi di riferimento. Alcuni testi, specialmente quelli per la programmazione e la gestione dei dati, saranno indicati all'inizio delle lezioni.
Testi di riferimento: