Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze
STATISTICA PER LE TECNOLOGIE E LE SCIENZE
Insegnamento
MODELLI STATISTICI APPLICATI
SCP4063831, A.A. 2018/19

Informazioni valide per gli studenti immatricolati nell'A.A. 2016/17

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea in
STATISTICA PER LE TECNOLOGIE E LE SCIENZE
SC2094, ordinamento 2014/15, A.A. 2018/19
N0
porta questa
pagina con te
Crediti formativi 9.0
Tipo di valutazione Voto
Denominazione inglese APPLIED STATISTICAL MODELS
Sito della struttura didattica http://www.stat.unipd.it/studiare/ammissione-lauree-triennali
Dipartimento di riferimento Dipartimento di Scienze Statistiche
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile GIULIANA CORTESE SECS-S/01
Altri docenti GIORGIO CELANT SECS-S/01

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
CARATTERIZZANTE Bio-sperimentale SECS-S/02 9.0

Organizzazione dell'insegnamento
Periodo di erogazione Secondo semestre
Anno di corso III Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LABORATORIO 2.5 20 42.5
LEZIONE 6.5 44 118.5

Calendario
Inizio attività didattiche 25/02/2019
Fine attività didattiche 14/06/2019
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2014

Commissioni d'esame
Commissione Dal Al Membri
3 Commissione a.a.2018/19 01/10/2018 30/09/2019 CORTESE GIULIANA (Presidente)
CELANT GIORGIO (Membro Effettivo)
VENTURA LAURA (Membro Effettivo)

Syllabus
Prerequisiti: Il corso prevede le conoscenze di:
Istituzioni di analisi matematica, Istituzioni di probabilità, Algebra lineare, Statistica I, Statistica II, Modelli statistici I.
Conoscenze e abilita' da acquisire: La finalità del corso consiste nell'introdurre gli studenti ai concetti basilari della pianificazione degli esperimenti e ai disegni di base. Inoltre, il corso ha la finalità di far conoscere agli studenti i metodi statistici di base e i modelli statistici per la descrizione e l'analisi di dati di durata e dati spaziali, provenienti da fenomeni in ambito ambientale, tecnologico e biomedico.
Attraverso un'intensa attività di laboratorio, il corso fornisce inoltre gli strumenti necessari per l'analisi al computer dei modelli e metodi statistici per dati di durata e dati spaziali, tramite il software statistico R.

Attraverso le attività di laboratorio, i lavori di gruppo e la programmazione di conferenze didattiche, lo studente impara a:
1. scegliere il piano degli esperimenti appropriato ed applicare i relativi metodi;
2. descrivere in termini statistici i fenomeni reali e riconoscere la tipologia di dati coinvolta;
3. identificare la metodologia e i modelli statistici più appropriati per l'analisi di ciascuna tipologia di dati;
4. riconoscere i limiti e i vantaggi di ciascun metodo e modello in base al fenomeno reale analizzato;
5. svolgere le analisi statistiche in modo critico e con autonomia di giudizio, anche riguardo a casi studio di interesse attuale.
Modalita' di esame: L'esame consiste in due prove:
1) una prova scritta sugli argomenti trattati nei tre moduli in cui è suddiviso il corso, la quale contiene sia alcune domande aperte e sia esercizi da risolvere analiticamente.
2) una prova pratica in laboratorio, consistente nell'analisi di dati tramite il software R, relativa agli argomenti trattati nei moduli II e III. Il risultato della prova consiste in una relazione sintetica delle analisi svolte, dei risultati ottenuti e delle risposte agli obiettivi di studio, accompagnata dal codice prodotto in R.
Criteri di valutazione: I criteri di verifica sono:
- comprensione e acquisizione degli argomenti svolti;
- capacità di applicare le conoscenze acquisite autonomamente e consapevolmente, sia in modo analitico sia tramite l'uso del software R;
- capacità di scelta critica dei metodi e modelli in base al tipo di informazione presente nei dati, e alle finalità dello studio di un fenomeno reale;
- capacità di interpretazione dei risultati di un'analisi statistica su dati di durata e dati spaziali.
Contenuti: Il corso fornisce alcuni metodi e modelli statistici, con particolare attenzione alle loro applicazioni in ambito tecnologico, ambientale e biomedico. È sviluppato in tre moduli distinti come segue:

Modulo I: disegno degli esperimenti.
Richiamo sui modelli lineari e il teorema di Gauss-Markov. Definizione di dispositivo sperimentale, definizione di trattamento e di unità sperimentale. Variabilità dell’unità sperimentale a seconda degli ambiti sperimentali. Un primo modello per descrivere un dispositivo a un solo fattore deterministico: parametrizzazione degli effetti. La casualizzazione: significato e sua necessità. Aspetto probabilistico della casualizzazione (l’operatore di Kemphtorne). Come la casualizzazione trasforma il modello semplice in un modello misto. Ipotesi che permettono di trattare il modello misto ottenuto come un modello semplice accorpando le varie fonti di aleatorietà. Inferenza sul nuovo modello (stima e test). Soluzione del quesito dello sperimentatore sugli effetti dei trattamenti tramite l’analisi della varianza. Riduzione della parte della variabilità dell’errore dovuta alla casualizzazione: la nozione della variabile blocco. Modello fattore principale/blocco. Analisi del modello. Limiti etici/economici/tecnologici dovuti alla formazione dei blocchi e il loro superamento tramite i blocchi incompleti. Analisi di alcuni dispositivi in blocchi incompleti. Matrice di incidenza. Piani connessi binari, propri ed equi- ripetuti. Funzioni stimabili: cenno sulle inverse generalizzate e il loro uso nello studio dei dispositivi a blocchi incompleti (matrice di Tocher). Inferenza dei modelli a blocchi incompleti. Generalizzazioni: quadrati latini e greco latini. Un cenno ai piani fattoriali frazionari.

Modulo II: modelli per l'analisi dei dati di durata.
Introduzione ai dati di durata e loro caratteristiche, funzioni probabilistiche fondamentali per lo studio di tali dati.
Analisi non parametrica: stimatori della funzione di sopravvivenza e della funzione di rischio cumulato.
Confronto tra diverse distribuzioni di dati di durata: test dei ranghi logaritmici per due campioni, e per più di due campioni. Cenni ai test alternativi.
Introduzione alla funzione di verosimiglianza per dati censurati a destra.
Modelli parametrici di regressione: modello a rischi moltiplicativi, modelli a tempi accelerati. Inferenza nei modelli parametrici di regressione esponenziale e Weibull.
Modelli semi-parametrici di regressione. Modello di Cox a rischi proporzionali e modello di Cox stratificato. Inferenza basata sulla verosimiglianza parziale.
Adeguatezza dei modelli e analisi dei residui.

Modulo III: modelli per l'analisi di dati spaziali e ambientali
.
Introduzione alla statistica spaziale e alla geostatistica. Esempi introduttivi di casi-studio e dati reali.
Caratteristiche fondamentali dei dati geostatistici e finalità dell'inferenza.
Il processo stocastico spaziale. Il processo stazionario al secondo ordine e intrinsecamente stazionario.
Il variogramma e la correlazione spaziale. Il variogramma campionario. Stima e stimatore del variogramma teorico.
Modelli parametrici per il variogramma e per la funzione di correlazione.
Il modello spaziale Gaussiano: inferenza, stima del variogramma sotto il modello, analisi dei residui.
l modello spaziale Gaussiano in presenza di errori di misura.
Cenni alla previsione spaziale: kriging semplice e ordinario.
Attivita' di apprendimento previste e metodologie di insegnamento: Il corso contiene lezioni frontali (modulo I: 20 ore, moduli II e III: 24 ore) ed esercitazioni in aula informatica (moduli II e III: 20 ore).
Le lezioni sono svolte con presentazione di lucidi in aula ed approfondimenti tramite brevi esercizi.
Le attività in laboratorio sono basate su un'analisi statistica esemplificativa svolta dal docente, seguita poi dalle analisi svolte dagli studenti per risolvere alcuni esercizi, sotto la guida del docente stesso.

Sono eventualmente previste attività in itinere con esercizi da risolvere in gruppo utilizzando il software R. Il corso prevede eventuali attività di seminari da parte di esperti esterni, volte ad illustrare casi reali di applicazioni nelle tecnologie e nelle scienze.
L'insegnamento è interattivo, con frequenti domande rivolte agli studenti.
Eventuali indicazioni sui materiali di studio: Le lezioni e i laboratori si basano su libri di testo. Durante il corso saranno resi disponibili eventuali appunti e lucidi delle lezioni, ed il codice R usato nei laboratori. In aggiunta, dove necessario, ulteriore materiale didattico e dispense saranno reperibili nel sito accessibile agli studenti.
Testi di riferimento:
  • Gary W. Oehlert, A First Course in Design and Analysis of Experiments. --: --, 2010. http://users.stat.umn.edu/~gary/book/fcdae.pdf
  • John P. Klein, Melvin L. Moeschberger, Survival analysis: Tecniques for censored and truncated data.. U.S. New York: Springer - Verlag (2nd edition), 2003. Cerca nel catalogo
  • Roger S. Bivand, Edzer J. Pebesma, Virgilio Gòmez- Rubio, Applied Spatial Data Analysis with R.. New York: Springer, 2008. Cerca nel catalogo
  • Peter J. Diggle, Paulo J. Ribeiro J., Model-based Geostatistics. U.S. New York: Springer, 2007. Cerca nel catalogo
  • Noel Cressie, Statistics for Spatial Data (Revised Edition). --: Wiley-Interscience, 2015. Cerca nel catalogo

Didattica innovativa: Strategie di insegnamento e apprendimento previste
  • Lecturing
  • Case study
  • Interactive lecturing
  • Working in group
  • Questioning
  • Problem solving
  • Files e pagine caricati online (pagine web, Moodle, ...)

Didattica innovativa: Software o applicazioni utilizzati
  • Moodle (files, quiz, workshop, ...)
  • software R

Obiettivi Agenda 2030 per lo sviluppo sostenibile
Salute e Benessere Industria, innovazione e infrastrutture Agire per il clima La vita sulla Terra