Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze
STATISTICA PER LE TECNOLOGIE E LE SCIENZE
Insegnamento
BASI DI DATI 2
SCP4063825, A.A. 2016/17

Informazioni valide per gli studenti immatricolati nell'A.A. 2014/15

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea in
STATISTICA PER LE TECNOLOGIE E LE SCIENZE
SC2094, ordinamento 2014/15, A.A. 2016/17
N0
porta questa
pagina con te
Crediti formativi 9.0
Tipo di valutazione Voto
Denominazione inglese DATABASES 2
Dipartimento di riferimento Dipartimento di Scienze Statistiche
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile MASSIMO MELUCCI ING-INF/05
Altri docenti MARCO DUSSIN

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
AFFINE/INTEGRATIVA Attività formative affini o integrative ING-INF/05 9.0

Organizzazione dell'insegnamento
Periodo di erogazione Secondo semestre
Anno di corso III Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LABORATORIO 1.5 12 25.5
LEZIONE 7.5 52 135.5

Calendario
Inizio attività didattiche 27/02/2017
Fine attività didattiche 09/06/2017
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2014

Commissioni d'esame
Commissione Dal Al Membri
3 Commissione a.a.2018/19 01/10/2018 30/09/2019 MELUCCI MASSIMO (Presidente)
DUSSIN MARCO (Membro Effettivo)
GIUNTA ANTONIO (Membro Effettivo)
ZINGIRIAN NICOLA (Membro Effettivo)
2 Commissione a.a.2017/18 01/10/2017 30/09/2018 MELUCCI MASSIMO (Presidente)
DUSSIN MARCO (Membro Effettivo)
FERRARI CARLO (Membro Effettivo)
ZINGIRIAN NICOLA (Membro Effettivo)

Syllabus
Prerequisiti: E' richiesta la conoscenza dei concetti di Basi di Dati 1, dell'architettura e del sistema operativo di un calcolatore e della programmazione illustrati in Sistemi di elaborazione 1.
Conoscenze e abilita' da acquisire: S'intende formare una figura professionale in grado di descrivere, raccogliere, organizzare, gestire e analizzare grandi moli di dati eterogenei mediante rigorose metodologie informatiche. A questo scopo, s'intende promuovere la conoscenza dei principali metodi e strumenti di gestione di dati strutturati, semi-strutturati e non strutturati, con speciale attenzione all'estrazione e all'analisi di basi di dati anche di grandi dimensioni. S'intendono poi delineare i concetti principali relativi ai sistemi informativi automatizzati mediante il World Wide Web (WWW) e le problematiche di natura informatica derivanti dalla gestione di enormi moli di dati (big data).
Modalita' di esame: L'esame consiste di una prova scritta e di una prova pratica che, nel caso dei non frequentanti o comunque in appelli successivi al primo, e' integrata da una prova orale. La prova scritta verte sui metodi di progettazione e accesso a basi di dati strutturati, semi-strutturati e non strutturati trattati durante l'insegnamento.

Per i frequentanti, la prova pratica del primo appello e' svolta in laboratorio, al calcolatore e in modo autonomo. Essa consiste nella realizzazione di semplici applicazioni di basi di dati strutturati, semi-strutturati e non strutturati, simili alle esercitazioni svolte durante le lezioni.

I non frequentanti o comunque coloro, anche frequentanti, che svolgono la prova in appelli successivi al primo, devono contattare il docente con un certo anticipo rispetto all'orale per concordare il tema della prova pratica che sara' realizzata in modo autonomo e discussa oralmente in sede d'esame. Il colloquio e' parte integrante della prova pratica.
Criteri di valutazione: Per la prova scritta, si valutera' innanzitutto la completezza, la competenza e la precisione di risposta ai quesiti. Si terra' conto anche della calligrafia e dell'ordine di tenuta del foglio d'esame.

Per la prova pratica, si valutera' innanzitutto l'utilizzo appropriato dei metodi e degli strumenti informatici. Si terra' conto della capacita' d'uso del calcolatore e di produrre autonomamente i file richiesti dal tema della prova. Nel caso di colloquio orale, si valuteranno anche le conoscenze generali dei contenuti dell'insegnamento oltre a quelle specifiche della prova pratica.

L'esame e' superato solo se si supera ciascuna prova con un voto sufficiente. Il voto finale d'esame e' la media dei voti delle due prove superate. E' possibile rifiutare il voto di una prova senza dover rifiutare il voto dell'altra prova. Una prova puo' essere sostenuta in un appello diverso da quello dell'altra prova. Il voto di una prova rimane valido fino all'ultimo appello previsto per l'anno accademico in cui si e' sostenuta la prova.
Contenuti: I contenuti dell'insegnamento vertono su tre tipi di dato fondamentali: strutturato, semi-strutturato e non-strutturato, come illustrato di seguito.

S'introdurranno le problematiche e le metodologie di analisi di basi di dati strutturati, anche di grandi dimensioni, con particolare attenzione all'efficienza. Si vedra' come Structured Query Language (SQL) puo' essere utilizzato per estrarre, riassumere e analizzare dati organizzati in tabelle, specialmente quando gli strumenti di analisi statistica non sono in grado di far fronte all'enorme massa delle basi di dati reali.

Si introdurranno gli elementi essenziali dell'organizzazione dei dati in memoria di massa e delle strutture per gli indici e si vedra' come la scelta degli indici ha effetto sull'efficienza dell'analisi dei dati. Si presentaranno - anche se solo in via d'accenno - i concetti e i risultati principali della teoria relazionale allo scopo di mostrare la logica con cui un SGBD ottimizza le proprie prestazioni.

S'introdurranno le problematiche e le metodologie di analisi di basi di dati semi-strutturati, sia quelli relazionali ad oggetti che quelli ad albero. Per i primi, si riprenderanno i concetti di classe ed ereditarieta' introdotti con il modello ER e s'introdurra' SQL-3. Per i secondi, si presenteranno i concetti generali dei dati semi-strutturati ad albero e le tecnologie eXtended Markup Language (XML), XPath e XQuery.

S'introdurranno le problematiche e le metodologie di analisi di collezioni di dati non strutturati (Information Retrieval, IR) che stanno alla base dei motori di ricerca. Si presenteranno inoltre i metodi principali di indicizzazione, reperimento e ordinamento. Si dara' cenno ai principali modelli teorici di reperimento. S'illustreranno le metodologie di valutazione dei sistemi di IR. Si accennera' alla tecnologia di tipo NoSQL.

L'attivita' di laboratorio vertera' su tutti gli argomenti trattati in aula durante le lezioni frontali oltre che gli argomenti relativi alle tecnologie d'accesso a basi di dati mediante WWW.
Attivita' di apprendimento previste e metodologie di insegnamento: L'attivita' di apprendimento principale si svolge in aula in forma di lezioni frontali tenute in italiano con l'ausilio della lavagna e del video proiettore. Sebbene la frequenza delle lezioni sia facoltativa, si consiglia di partecipare alle lezioni comunque, specialmente a quelle di laboratorio.

Attivita' altrettanto importante e' lo studio individuale e in particolare lo svolgimento di esercitazioni proposte alle lezioni di laboratorio da svolgere in modo individuale o in coppia. Ogni esercitazione dovra' essere consegnata appena dopo la lezione in cui e' stata proposta e comunque prima della lezione di laboratorio successiva. Lo svolgimento regolare delle esercitazioni facilita quello della prova pratica d'esame. Si raccomanda di approfittare del ricevimento per presentare le esercitazioni in via di svolgimento e ottenere suggerimenti dal docente.

Durante l'attivita' di laboratorio, si affronteranno le problematiche dell'accesso a basi di dati mediante il WWW mediante linguaggi di scripting come ad esempio PHP e Javascript.
Eventuali indicazioni sui materiali di studio: Prima dell'inizio delle lezioni sara' resa disponbile una dispensa con i contenuti delle lezioni. Il materiale delle esercitazioni di laboratorio sara' reso disponibile man mano che si procede l'insegnamento.
Testi di riferimento:
  • Melucci, Massimo, Basi di dati. Bologna: Esculapio, 2013. Edizione di settembre (non quella di marzo) 2013. Capitoli: 3, 4, 5, 6 Cerca nel catalogo
  • Melucci, Massimo, Information Retrieval: metodi e modelli per motori di ricerca. Milano: Franco Angeli, 2013. Capitoli: 1, 2, 3, 4, 5 Cerca nel catalogo
  • Atzeni, Paolo et al, Basi di dati. Milano: McGraw-Hill, 2014. Capitoli: 3, 4, 5, 9, 11, 14, 18 (consultazione), 19. Paragrafi: 13.1-2, Cerca nel catalogo
  • Linoff, Gordon S., Data Analysis Using SQL and Excel. Indianapolis, IN, USA: Wiley, 2008. Per consultazione.