Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze
SCIENZE STATISTICHE
Insegnamento
BIOSTATISTICA COMPUTAZIONALE E BIOINFORMATICA
SCP4063318, A.A. 2018/19

Informazioni valide per gli studenti immatricolati nell'A.A. 2017/18

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
SCIENZE STATISTICHE
SS1736, ordinamento 2014/15, A.A. 2018/19
N0
porta questa
pagina con te
Crediti formativi 9.0
Tipo di valutazione Voto
Denominazione inglese COMPUTATIONAL BIOSTATISTICS AND BIOINFORMATICS
Sito della struttura didattica http://www.stat.unipd.it/studiare/ammissione-laurea-magistrale
Dipartimento di riferimento Dipartimento di Scienze Statistiche
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile DAVIDE RISSO SECS-S/01

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
CARATTERIZZANTE Statistico SECS-S/02 9.0

Organizzazione dell'insegnamento
Periodo di erogazione Primo semestre
Anno di corso II Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LABORATORIO 3.0 24 51.0
LEZIONE 6.0 40 110.0

Calendario
Inizio attività didattiche 01/10/2018
Fine attività didattiche 18/01/2019
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2014

Commissioni d'esame
Commissione Dal Al Membri
4 Commissione a.a.2018/19 01/10/2018 30/09/2019 RISSO DAVIDE (Presidente)
CALURA ENRICA (Membro Effettivo)
CORTESE GIULIANA (Membro Effettivo)

Syllabus
Prerequisiti: Statistica progredito, Calcolo delle Probabilità e Modelli Statistici II.
Conoscenze e abilita' da acquisire: Introduzione ai problemi biologici legati alla complessità dei dati provenienti dalle nuove tecniche di sequenziamento.
Introduzione ai modelli statistici per dati genomici e trascrittomici.
Capacità di affrontare l'analisi completa dei dati: dal dato grezzo all'interpretazione del risultato.
Capacità di scrivere una breve tesina su un dataset opportunamente assegnato dal docente.
Modalita' di esame: Esame scritto e predisposizione di una "tesina" su un dataset assegnato dal docente.
Criteri di valutazione: Saranno criteri di valutazione:
la capacità espositiva della tesina, la congruenza dei metodi usati per l'analisi dei dati assegnati, e la completezza delle risposte nell'esame scritto.
Ulteriori criteri saranno l'analisi critica dei risultati e l'indipendenza nell'afforntare i temi proposti.
Contenuti: Il completamento del progetto genoma umano e con esso l'inizio di una serie di progetti di sequenziamento sistematico di molti organismi complessi ha aumentato enormemente la quantità di informazioni disponibili riguardanti sequenze geniche e proteiche. Questa grande disponibilità di dati biologici ha quindi rivoluzionato e rivoluzionerà ulteriormente la ricerca genetica e la comprensione di molti aspetti biologici quali la regolazione genica, l'interazione fra proteine e l'attivazione e la soppressione di vie metaboliche. In questo contesto quindi, la quantità di dati congiuntamente alla natura complessa degli stessi hanno reso l'analisi statistica un passo obbligato per la loro comprensione.
Il corso tratterà i seguenti argomenti:
- Introduzione alla Genomica, Trascrittomica e Proteomica. Database di dati genomici di riferimento mondiale disponibili al National Center of Biotechnology Information (NCBI), GeneBank, GEO, EntrezGene, OMIM, e in altri centri di riferimento, SwissProt, UniProt, Pfam. Sistemi integrati di interazione con questi database (interfacce web).
- Allineamento di sequenze. Algoritmi di allineamento, allineamenti globali e locali. Programmazione Dinamica, algoritmi euristici (BLAST, FASTA). Significatività dello score di un allineamento.
- Analisi di dati di espressione derivanti da esperimenti di RNA-seq. Normalizzazione dei dati, metodi globali e locali (lowess), trasformazioni per la stabilizzazione della varianza. Applicazione di analisi cluster e analisi discriminante. Verifica d'ipotesi per l'identificazione di geni differenzialmente espressi, test moderati, approcci permutazionali. Problema dei confronti multipli, controllo del False Discovery Rate (FDR).
Metodi di classificazione, Gene set Analysis.
Attivita' di apprendimento previste e metodologie di insegnamento: Lezioni frontali e laboratori informatici
Eventuali indicazioni sui materiali di studio: Materiale didattico predisposto dal docente.
Testi di riferimento:
  • Rafael A. Irizarry, Michael I. Love, Data Analysis for the Life Sciences with R. --: Chapman and Hall/CRC, 2018. Cerca nel catalogo