Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Ingegneria
INGEGNERIA INFORMATICA
Insegnamento
BIG DATA COMPUTING
INP7079233, A.A. 2018/19

Informazioni valide per gli studenti immatricolati nell'A.A. 2018/19

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
INGEGNERIA INFORMATICA
IN0521, ordinamento 2009/10, A.A. 2018/19
N0
porta questa
pagina con te
Crediti formativi 6.0
Tipo di valutazione Voto
Denominazione inglese BIG DATA COMPUTING
Dipartimento di riferimento Dipartimento di Ingegneria dell'Informazione (DEI)
Obbligo di frequenza No
Lingua di erogazione INGLESE
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile ANDREA ALBERTO PIETRACAPRINA INF/01

Mutuazioni
Codice Insegnamento Responsabile Corso di studio
INP7079233 BIG DATA COMPUTING ANDREA ALBERTO PIETRACAPRINA IN2371
SCP7079297 BIG DATA COMPUTING ANDREA ALBERTO PIETRACAPRINA SC1176
INP7079233 BIG DATA COMPUTING ANDREA ALBERTO PIETRACAPRINA IN2371
SCP7079297 BIG DATA COMPUTING ANDREA ALBERTO PIETRACAPRINA SC2377

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
AFFINE/INTEGRATIVA Attività formative affini o integrative INF/01 2.0
CARATTERIZZANTE Ingegneria informatica ING-INF/05 4.0

Modalità di erogazione
Periodo di erogazione Secondo semestre
Anno di corso I Anno
Modalità di erogazione frontale

Organizzazione della didattica
Tipo ore Crediti Ore di
Corso
Ore Studio
Individuale
Turni
LEZIONE 6.0 48 102.0 Nessun turno

Calendario
Inizio attività didattiche 25/02/2019
Fine attività didattiche 14/06/2019

Syllabus
Prerequisiti: Il corso ha i seguenti prerequisiti: competenze relative al progetto e all'analisi di algoritmi e strutture dati, conoscenza delle nozioni fondamentali di calcolo delle probabilità e statistica, e capacità di programmazione in Java o Python.
Conoscenze e abilita' da acquisire: In questo corso gli studenti imparano tecniche algoritmiche fondamentali per l'elaborazione efficiente ed efficace di insiemi di dati di grande dimensione. Inoltre, attraverso alcune attività pratiche, essi acquisiscono abilità relative allo sviluppo di applicazioni in Apache Spark, che è uno dei framework di programmazione più popolari e diffusi per big data computing.
Modalita' di esame: L'esame consiste in alcuni homework di programmazione, assegnati ogni 2-3 settimane e da svolgere in gruppi di 3-4 studenti, e in una prova scritta individuale comprendente domande teoriche ed esercizi.
Criteri di valutazione: La valutazione finale è basata sugli homework e sulla prova scritta. Gli homework mirano a verificare la capacità degli studenti di programmare applicazioni big data in Apache Spark, mentre la prova scritta mira a verificare la loro conoscenza delle tecniche algoritmiche apprese durante il corso e la loro capacità di problem solving nel contesto big data.
Contenuti: Il corso affronterà i seguenti argomenti:

Introduzione al fenomeno dei Big Data
Programming frameworks: MapReduce/Hadoop, Spark
Clustering
Association Analysis
Graph Analytics (metriche di centralità, scale-free/Power-law graphs, fenomeno dello small world, uncertain graphs)
Similarity and diversity search
Attivita' di apprendimento previste e metodologie di insegnamento: Lezioni frontali e attività propedeutiche allo svolgimento degli homework.
Eventuali indicazioni sui materiali di studio: Il diario delle lezioni, il materiale didattico e le modalità d'esame dettagliate sono resi disponibili sul sito web accessibile anche da MOODLE:

http://www.dei.unipd.it/~capri/BDC/
Testi di riferimento:
  • J. Leskovec, A. Rajaraman and J. Ullman, Mining Massive Datasets. --: Cambridge University Press, 2014. Available in pdf Cerca nel catalogo

Didattica innovativa: Strategie di insegnamento e apprendimento previste
  • Lecturing
  • Case study
  • Working in group
  • Questioning
  • Problem solving
  • Files e pagine caricati online (pagine web, Moodle, ...)

Didattica innovativa: Software o applicazioni utilizzati
  • Moodle (files, quiz, workshop, ...)

Obiettivi Agenda 2030 per lo sviluppo sostenibile
Istruzione di qualita' Industria, innovazione e infrastrutture