Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Ingegneria
INGEGNERIA INFORMATICA
Insegnamento
BIG DATA COMPUTING (Numerosita' canale 1)
INP7079233, A.A. 2019/20

Informazioni valide per gli studenti immatricolati nell'A.A. 2019/20

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
INGEGNERIA INFORMATICA
IN0521, ordinamento 2009/10, A.A. 2019/20
N2cn1
porta questa
pagina con te
Crediti formativi 6.0
Tipo di valutazione Voto
Denominazione inglese BIG DATA COMPUTING
Dipartimento di riferimento Dipartimento di Ingegneria dell'Informazione (DEI)
Sito E-Learning https://elearning.dei.unipd.it/course/view.php?idnumber=2019-IN0521-000ZZ-2019-INP7079233-N2CN1
Obbligo di frequenza No
Lingua di erogazione INGLESE
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile ANDREA ALBERTO PIETRACAPRINA INF/01

Mutuazioni
Codice Insegnamento Responsabile Corso di studio
SCP7079297 BIG DATA COMPUTING ANDREA ALBERTO PIETRACAPRINA SC1176
SCP7079297 BIG DATA COMPUTING ANDREA ALBERTO PIETRACAPRINA SC2377
INP7079233 BIG DATA COMPUTING (Numerosita' canale 1) ANDREA ALBERTO PIETRACAPRINA IN0520
INP7079233 BIG DATA COMPUTING (Numerosita' canale 1) ANDREA ALBERTO PIETRACAPRINA IN2371
INP7079233 BIG DATA COMPUTING (Numerosita' canale 1) ANDREA ALBERTO PIETRACAPRINA IN2371

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
AFFINE/INTEGRATIVA Attività formative affini o integrative INF/01 2.0
CARATTERIZZANTE Ingegneria informatica ING-INF/05 4.0

Organizzazione dell'insegnamento
Periodo di erogazione Secondo semestre
Anno di corso I Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LEZIONE 6.0 48 102.0

Calendario
Inizio attività didattiche 02/03/2020
Fine attività didattiche 12/06/2020
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2009

Commissioni d'esame
Commissione Dal Al Membri
4 A.A. 2019/2020 01/10/2019 15/03/2021 SILVESTRI FRANCESCO (Presidente)
PIETRACAPRINA ANDREA ALBERTO (Membro Effettivo)
BILARDI GIANFRANCO (Supplente)
VANDIN FABIO (Supplente)
3 A.A. 2019/2020 01/10/2019 15/03/2021 PIETRACAPRINA ANDREA ALBERTO (Presidente)
SILVESTRI FRANCESCO (Membro Effettivo)
BILARDI GIANFRANCO (Supplente)
FANTOZZI CARLO (Supplente)
PUCCI GEPPINO (Supplente)
VANDIN FABIO (Supplente)
2 A.A. 2018/2019 01/10/2018 15/03/2020 PIETRACAPRINA ANDREA ALBERTO (Presidente)
PUCCI GEPPINO (Membro Effettivo)
BILARDI GIANFRANCO (Supplente)
FANTOZZI CARLO (Supplente)
PESERICO STECCHINI NEGRI DE SALVI ENOCH (Supplente)
SILVESTRI FRANCESCO (Supplente)
VANDIN FABIO (Supplente)

Syllabus
Prerequisiti: Il corso ha i seguenti prerequisiti: competenze relative al progetto e all'analisi di algoritmi e strutture dati, conoscenza delle nozioni fondamentali di calcolo delle probabilità e statistica, e capacità di programmazione in Java o Python.
Conoscenze e abilita' da acquisire: In questo corso gli studenti imparano tecniche algoritmiche fondamentali per l'elaborazione efficiente ed efficace di insiemi di dati di grande dimensione. Inoltre, attraverso alcune attività pratiche, essi acquisiscono abilità relative allo sviluppo di applicazioni in Apache Spark, che è uno dei framework di programmazione più popolari e diffusi per big data computing.
Modalita' di esame: L'esame consiste in alcuni homework di programmazione, assegnati ogni 2-3 settimane e da svolgere in gruppi di 3-4 studenti, e in una prova scritta individuale comprendente domande teoriche ed esercizi.
Criteri di valutazione: La valutazione finale è basata sugli homework e sulla prova scritta. Gli homework mirano a verificare la capacità degli studenti di programmare applicazioni big data in Apache Spark, mentre la prova scritta mira a verificare la loro conoscenza delle tecniche algoritmiche apprese durante il corso e la loro capacità di problem solving nel contesto big data.
Contenuti: Il corso affronterà i seguenti argomenti:

Introduzione al fenomeno dei Big Data
Programming frameworks: MapReduce/Hadoop, Spark
Clustering
Association Analysis
Graph Analytics (metriche di centralità, scale-free/Power-law graphs, fenomeno dello small world, uncertain graphs)
Similarity and diversity search
Attivita' di apprendimento previste e metodologie di insegnamento: Lezioni frontali e attività propedeutiche allo svolgimento degli homework.
Eventuali indicazioni sui materiali di studio: Il diario delle lezioni, il materiale didattico e le modalità d'esame dettagliate sono resi disponibili sul sito web del corso accessibile anche da MOODLE.
Testi di riferimento:
  • J. Leskovec, A. Rajaraman and J. Ullman, Mining Massive Datasets. --: Cambridge University Press, 2014. Available in pdf Cerca nel catalogo