Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze
INFORMATICA
Insegnamento
REPERIMENTO DELL'INFORMAZIONE
SCP7080257, A.A. 2019/20

Informazioni valide per gli studenti immatricolati nell'A.A. 2019/20

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
INFORMATICA
SC1176, ordinamento 2014/15, A.A. 2019/20
N0
porta questa
pagina con te
Crediti formativi 6.0
Tipo di valutazione Voto
Denominazione inglese INFORMATION RETRIEVAL
Sito della struttura didattica http://informatica.scienze.unipd.it/2019/laurea_magistrale
Dipartimento di riferimento Dipartimento di Matematica
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile MARISTELLA AGOSTI ING-INF/05
Altri docenti GIANMARIA SILVELLO ING-INF/05

Mutuante
Codice Insegnamento Responsabile Corso di studio
INM0016444 REPERIMENTO DELL'INFORMAZIONE MARISTELLA AGOSTI IN0521

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
CARATTERIZZANTE Discipline Informatiche INF/01 6.0

Organizzazione dell'insegnamento
Periodo di erogazione Primo semestre
Anno di corso I Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LEZIONE 6.0 48 102.0

Calendario
Inizio attività didattiche 30/09/2019
Fine attività didattiche 18/01/2020
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2014

Syllabus
Prerequisiti:
Conoscenze e abilita' da acquisire: Competenze critiche e avanzate di ideazione, progettazione, realizzazione e valutazione di sistemi di reperimento dell'informazione (Information Retrieval System, IRS) e motori di ricerca (Search Engines).
Modalita' di esame: 1. Progetto: viene realizzato con due homework, uno individuale e uno da svolgere in gruppo e con presentazione seminariale; gli obiettivi e i contenuti degli homework vengono presentati a lezione.
2. Esame scritto con domande sui tutti i contenuti trattati nelle lezioni dell'insegnamento. Esempi di compiti degli anni accademici precedenti vengono resi disponibili durante il corso.
3. Eventuale integrazione orale.
Criteri di valutazione: La prova finale serve a verificare l'acquisizione di competenze relative alla capacità di valutare, ideare, progettare, reingegnerizzare, realizzare e gestire sistemi di reperimento dell'informazione e motori di ricerca.
Il progetto serve a verificare in modo sperimentale la capacità di applicare le competenze acquisite.
Contenuti: I sistemi e i servizi di reperimento dell'informazione sono sistemi pervasivi che vengono utilizzati ogni giorno in attività di acquisizione di informazioni, di gestione amministrativa, di acquisizione di competenze, di intrattenimento e comunicazione da parte di milioni di utenti esperti e finali. I motori di ricerca e i sistemi di reperimento dell'informazione gestiscono grandi quantità di informazioni, documenti e risorse digitali (big data).

I motori di ricerca (search engines) sono gli strumenti di reperimento dell'informazione più conosciuti e utilizzati per acquisire informazioni su persone, eventi e risultati scientifici. Grazie ai risultati ottenuti e le informazioni acquisite tramite i motori di ricerca si prendono decisioni e si svolgono attività di lavoro e personali.

Sono strumenti di reperimento dell'informazione anche quelli incorporati nei diversi media sociali (social media) che vengono utilizzati ogni giorno per scopi professionali e personali da utenti di tutto il mondo e tutti quei sistemi che permettono di recuperare informazioni dai messaggi di posta elettronica, dai documenti e dagli archivi presenti sui dispositivi di memorizzazione permanente utilizzati nei diversi strumenti di elaborazione delle informazioni che le persone oggi hanno in uso personale.

I contenuti del corso permettono di acquisire competenze per la ideazione, progettazione, realizzazione e valutazione di sistemi di reperimento dell'informazione e motori di ricerca. La presentazione dei contenuti è articolata nelle seguenti parti:
- Elementi introduttivi (quadro d'insieme) per la rappresentazione, gestione e reperimento automatico dell'informazione in formato digitale
- Indicizzazione: rappresentazione del contenuto dei documenti testuali, il processo di indicizzazione e le sue fasi principali, word embeddings
- Modelli di reperimento dell'informazione: modello booleano, livello di coordinamento, modello vettoriale, word embeddings, modello probabilistico, language models, neural IR
- Sistemi di IR, data visualisation
- Valutazione: la valutazione in IR, collezioni sperimentali (Cranfield, TREC), misure di efficacia e di efficienza, analisi statistiche, precision medicine
- Web search: la struttura del Web, interrogazioni e utenti, agenti Web (Web Crawler), Search Engine Optimization (SEO).
Attivita' di apprendimento previste e metodologie di insegnamento: L'insegnamento si basa su lezioni frontali e attività sperimentali.
La frequenza alle lezioni è fortemente consigliata, perché il corso è progettato per studenti che frequentano con costanza le lezioni, seguono le attività sperimentali del corso e realizzano il progetto.
Informazioni relative al diario delle lezioni, al materiale didattico, alle scadenze e modalità d'esame sono rese disponibili agli studenti in Moodle.
Eventuali indicazioni sui materiali di studio: I materiali di studio sono resi disponibili in Moodle.

Il libro di testo di riferimento è:
Donald Metzler, Trevor Strohman, and W. Bruce Croft. Search Engines: Information Retrieval in Practice.
Il testo è disponibile e scaricabile liberamente all'URL:
http://ciir.cs.umass.edu/downloads/SEIRiP.pdf

Un utile riferimento aggiuntivo è:
Cornelis Joost (Keith) van Rijsbergen. Information Retrieval (2° Ed). London, Butterworths, 1979
anche questo testo è e scaricabile liberamente all'URL: http://www.dcs.gla.ac.uk/Keith/Preface.html

Documentazione aggiuntiva viene resa disponibile in formato elettronico in Moodle.
Testi di riferimento:
  • Croft, W. Bruce; Metzler, Donald; Strohman, Trevor, Search engines: information retrieval in practice. Boston: Pearson, 2010. Cerca nel catalogo

Didattica innovativa: Strategie di insegnamento e apprendimento previste
  • Lecturing
  • Laboratory
  • Problem based learning
  • Working in group
  • Files e pagine caricati online (pagine web, Moodle, ...)

Didattica innovativa: Software o applicazioni utilizzati
  • Moodle (files, quiz, workshop, ...)