Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze umane, sociali e del patrimonio culturale
STRATEGIE DI COMUNICAZIONE
Insegnamento
METODI STATISTICI DI ANALISI DEI TESTI
LE01122622, A.A. 2016/17

Informazioni valide per gli studenti immatricolati nell'A.A. 2016/17

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
STRATEGIE DI COMUNICAZIONE
IF0315, ordinamento 2015/16, A.A. 2016/17
N0
porta questa
pagina con te
Crediti formativi 6.0
Tipo di valutazione Voto
Denominazione inglese STATISTICAL METHODS FOR TEXT ANALYSIS
Dipartimento di riferimento Dipartimento di Studi Linguistici e Letterari (DiSLL)
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile ARJUNA TUZZI SECS-S/05

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
CARATTERIZZANTE Discipline socio-economiche, storico-politiche e cognitive SECS-S/05 6.0

Modalità di erogazione
Periodo di erogazione Primo semestre
Anno di corso I Anno
Modalità di erogazione frontale

Organizzazione della didattica
Tipo ore Crediti Ore di
Corso
Ore Studio
Individuale
Turni
LEZIONE 6.0 42 108.0 Nessun turno

Calendario
Inizio attività didattiche 27/09/2016
Fine attività didattiche 20/01/2017

Commissioni d'esame
Commissione Dal Al Membri
1 1718 01/10/2017 30/11/2018 TUZZI ARJUNA (Presidente)
COCCO MICHELE (Membro Effettivo)
SBALCHIERO STEFANO (Membro Effettivo)
CORTELAZZO MICHELE (Supplente)

Syllabus
Prerequisiti: Nessuno
Conoscenze e abilita' da acquisire: Il corso affronta i principali metodi di analisi quantitativa dati testuali ed esamina diverse strategie per l'acquisizione, la sintesi e la restituzione delle informazioni contenute in corpora testuali di grandi dimensioni. Il corso offre strumenti di analisi per tutti quei contesti applicativi in cui la fonte di informazioni è costituita da raccolte di testi (documenti, pagine web, blog, discorsi, opere letterarie, quotidiani, messaggi pubblicitari, interviste ecc.).
L'apprendimento di concetti teorici e la sperimentazione sul campo di competenze tecniche intendono sviluppare la capacità di riconoscere gli aspetti rilevanti dei problemi (problem setting), di valutare criticamente le diverse soluzioni possibili (SWOT analysis) e di progettare autonomamente un intero percorso di lavoro (problem solving).
L'attività di laboratorio intende promuovere l'attitudine al lavoro di ricerca (individuale e di gruppo) e di sviluppare competenze specifiche per comunicare in modo qualificato scelte metodologiche adottate e risultati ottenuti.

Il corso prende in considerazione tre diversi approcci:
1) approccio «classico» all'analisi del contenuto;
2) linguistica quantitativa;
3) approccio «moderno» all'analisi dei dati testuali.

Agli studenti interessati al corso di "Metodi statistici di analisi dei testi" si consiglia di frequentare anche il corso del prof. Neresini "Scienza, tecnologia e società" (usando i crediti a libera scelta).
Modalita' di esame: 1) Valutazione di una relazione scritta (individuale o di gruppo) basata sull'analisi dei dati testuali di un corpus. L'argomento e le modalità di consegna della relazione saranno concordati con la docente.

2) Discussione orale oppure esame scritto (verifica intermedia riservata agli studenti frequentanti).
Criteri di valutazione: La valutazione della relazione scritta prende in considerazione le analisi scelte per l’esplorazione del corpus, la coerenza del percorso con le ipotesi di partenza e la qualità dei risultati ottenuti.
Contenuti: Approccio «classico» all'analisi del contenuto.
- cenni storici;
- corpora, testi, frammenti;
- processi di strutturazione e codifica delle informazioni (ex ante ed ex post);
- limiti e vantaggi dei metodi classici.

Linguistica quantitativa
- word-token, word-type, vocabolario, frequenza, tassi di copertura;
- misure lessicometriche;
- leggi.

Approccio «moderno» all'analisi dei dati testuali.
- rielaborazioni delle unità statistiche testuali;
- normalizzazione e codifica;
- selezione delle unità testuali più interessanti;
- confronto tra testi;
- limiti e vantaggi dei metodi moderni.
Attivita' di apprendimento previste e metodologie di insegnamento: Le lezioni si svolgono in laboratorio informatico con il supporto di software per l'analisi automatica e semiautomatica dei testi in modo da poter alternare momenti di riflessione teorica con sessioni di lavoro dedicate all'applicazione pratica delle competenze acquisite.
L'apprendimento di competenze specialistiche è improntato soprattutto sulle logiche di funzionamento degli strumenti (anche software) al fine di addestrare gli studenti ad operare sia nello stesso contesto con strumenti diversi sia con lo stesso strumento in contesti diversi.
Eventuali indicazioni sui materiali di studio: Una parte dei materiali di studio sarà fornita dalla docente durante il corso (slides, articoli, corpora).
Testi di riferimento:
  • Arjuna Tuzzi, L'analisi del contenuto. Introduzione ai metodi e alle tecniche di ricerca.. Roma: Carocci, 2003. Cerca nel catalogo
  • Luca Giuliano, Gevisa La Rocca, L’analisi automatica e semi-automatica dei dati testuali Vol. I – Software e istruzioni per l’uso. Milano: LED, 2008.
  • Manlio Cortelazzo, Arjuna Tuzzi, Metodi statistici applicati all'italiano. Bologna: Zanichelli, 2008. Cerca nel catalogo
  • Luca Giuliano, Gevisa La Rocca, L’analisi automatica e semi-automatica dei dati testuali. Vol. II – Strategie di analisi e applicazioni. Milano: LED, 2010. Cerca nel catalogo
  • Sergio Bolasco, L' analisi automatica dei testi. Fare ricerca con il text mining. Roma: Carocci, 2013. Cerca nel catalogo
  • Luca Giuliano, The value of words. Roma: Dipartimento di Scienze statistiche, 2014.