Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze umane, sociali e del patrimonio culturale
STRATEGIE DI COMUNICAZIONE
Insegnamento
METODI STATISTICI DI ANALISI DEI TESTI
LE01122622, A.A. 2017/18

Informazioni valide per gli studenti immatricolati nell'A.A. 2017/18

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
STRATEGIE DI COMUNICAZIONE
IF0315, ordinamento 2015/16, A.A. 2017/18
N0
porta questa
pagina con te
Crediti formativi 6.0
Tipo di valutazione Voto
Denominazione inglese STATISTICAL METHODS FOR TEXT ANALYSIS
Dipartimento di riferimento Dipartimento di Studi Linguistici e Letterari (DiSLL)
Sito E-Learning https://elearning.unipd.it/scienzeumane/course/view.php?idnumber=2017-IF0315-000ZZ-2017-LE01122622-N0
Obbligo di frequenza No
Lingua di erogazione ITALIANO
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile ARJUNA TUZZI SECS-S/05

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
CARATTERIZZANTE Discipline socio-economiche, storico-politiche e cognitive SECS-S/05 6.0

Modalità di erogazione
Periodo di erogazione Primo semestre
Anno di corso I Anno
Modalità di erogazione frontale

Organizzazione della didattica
Tipo ore Crediti Ore di
Corso
Ore Studio
Individuale
Turni
LEZIONE 6.0 42 108.0 Nessun turno

Calendario
Inizio attività didattiche 02/10/2017
Fine attività didattiche 19/01/2018

Commissioni d'esame
Nessuna commissione d'esame definita

Syllabus
Prerequisiti: ATTENZIONE! IL CORSO COMINCIA IL 9 NOVEMBRE

Per la frequenza al corso è richiesta la conoscenza di elementi di Statistica di base.
Conoscenze e abilita' da acquisire: Il corso affronta i principali metodi di analisi quantitativa dati testuali ed esamina diverse strategie per l'acquisizione, la sintesi e la restituzione delle informazioni contenute in corpora testuali di grandi dimensioni. Il corso offre strumenti di analisi per tutti quei contesti applicativi in cui la fonte di informazioni è costituita da raccolte di testi (documenti, pagine web, blog, discorsi, opere letterarie, quotidiani, messaggi pubblicitari, interviste ecc.).
L'apprendimento di concetti teorici e la sperimentazione sul campo di competenze tecniche intendono sviluppare la capacità di riconoscere gli aspetti rilevanti dei problemi (problem setting), di valutare criticamente le diverse soluzioni possibili e di progettare autonomamente un intero percorso di lavoro (problem solving).
Per gli studenti frequentanti l'attività di laboratorio intende promuovere l'attitudine al lavoro di ricerca (individuale e di gruppo) e di sviluppare competenze specifiche per comunicare in modo qualificato scelte metodologiche adottate e risultati ottenuti.

Il corso prende in considerazione tre diversi approcci:
1) approccio «classico» all'analisi del contenuto;
2) linguistica quantitativa;
3) approccio «moderno» all'analisi dei dati testuali;
4) software per l'analisi dei testi.
Modalita' di esame: STUDENTI FREQUENTANTI
1) Valutazione di una relazione scritta (individuale o di gruppo) basata sull'analisi di un corpus a scelta. L'argomento e le modalità di consegna della relazione saranno concordati con la docente.
2) Prova scritta intermedia con domande a risposta aperta breve (verifica riservata agli studenti frequentanti).

STUDENTI NON FREQUENTANTI
Esame scritto con domande a risposta aperta.
Le prime domande del compito scritto sono di carattere teorico e basate sul volume "L'analisi del contenuto" (Tuzzi, 2003).
ATTENZIONE! L'ultima domanda del compito scritto richiederà agli studenti non frequentanti di descrivere gli strumenti offerti da un software a scelta. Gli studenti dovranno dimostrare di aver provato a utilizzare almeno un software per l'analisi quantitativa dei dati testuali e di essere in grado di descrivere i passi essenziali del processo di analisi di un corpus, dalla raccolta dei testi all'interpretazione dei risultati. Il software deve essere scelto tra quelli presentati nei tre volumi in bibliografia: Giuliano e La Rocca 2004, Giuliano e La Rocca 2011, Giuliano 2013. Ulteriori software possono essere scelti solo se concordati con la docente prima dell'esame scritto.
Criteri di valutazione: STUDENTI FREQUENTANTI
La valutazione della relazione scritta prende in considerazione le analisi scelte per l’esplorazione del corpus, la coerenza del percorso con le ipotesi di partenza e la qualità dei risultati ottenuti.
La valutazione della prova scritta è un punteggio da 1 a 10.

STUDENTI NON FREQUENTANTI
La valutazione dell'esame scritto è in trentesimi.
Contenuti: Approccio «classico» all'analisi del contenuto.
- cenni storici;
- corpora, testi, frammenti;
- processi di strutturazione e codifica delle informazioni (ex ante ed ex post);
- limiti e vantaggi dei metodi classici.

Linguistica quantitativa
- word-token, word-type, vocabolario, frequenza, tassi di copertura;
- misure lessicometriche;
- leggi.

Approccio «moderno» all'analisi dei dati testuali.
- rielaborazioni delle unità statistiche testuali;
- normalizzazione e codifica;
- selezione delle unità testuali più interessanti;
- confronto tra testi;
- limiti e vantaggi dei metodi moderni.

Software per l'analisi dei dati testuali
Attivita' di apprendimento previste e metodologie di insegnamento: Per gli studenti frequentanti parte delle lezioni si svolgono in laboratorio informatico con il supporto di software per l'analisi automatica e semiautomatica dei testi in modo da poter alternare momenti di riflessione teorica con sessioni di lavoro dedicate all'applicazione pratica delle competenze acquisite. L'apprendimento di competenze specialistiche è improntato soprattutto sulle logiche di funzionamento degli strumenti (anche software) al fine di addestrare gli studenti ad operare sia nello stesso contesto con strumenti diversi sia con lo stesso strumento in contesti diversi.
Eventuali indicazioni sui materiali di studio: ATTENZIONE! Ulteriori informazioni sui materiali di studio sono disponibili sulla pagina moodle dell'insegnamento.

STUDENTI FREQUENTANTI
1) Materiali forniti dalla docente
2) Arjuna Tuzzi, L'analisi del contenuto. Introduzione ai metodi e alle tecniche di ricerca. Roma: Carocci, 2003.

STUDENTI NON FREQUENTANTI
- PARTE TEORICA
Arjuna Tuzzi, L'analisi del contenuto. Introduzione ai metodi e alle tecniche di ricerca. Roma: Carocci, 2003.
- APPRENDIMENTO DI UN SOFTWARE:
Luca Giuliano, Gevisa La Rocca, L’analisi automatica e semi-automatica dei dati testuali Vol. I – Software e istruzioni per l’uso. Milano: LED, 2008.
Luca Giuliano, Gevisa La Rocca, L’analisi automatica e semi-automatica dei dati testuali. Vol. II – Strategie di analisi e applicazioni. Milano: LED, 2010.
Luca Giuliano, The value of words. Roma: Dipartimento di Scienze statistiche, 2014 / Il valore delle parole. Roma: Dipartimento di Scienze statistiche, 2013

LINK:
http://www.ledonline.it/ledonline/giuliano/giuliano-analisi-automatica-dati-testuali.pdf
http://www.ledonline.it/ledonline/giuliano/giuliano-analisi-automatica-dati-testuali-II.pdf
http://www.dss.uniroma1.it/it/system/files/pubblicazioni/TheValueOfWords-DS3-1.pdf
http://www.dss.uniroma1.it/it/system/files/pubblicazioni/ValoreDelleParoleV2a.pdf
Testi di riferimento:
  • Arjuna Tuzzi, L'analisi del contenuto. Introduzione ai metodi e alle tecniche di ricerca. Roma: Carocci, 2003. Cerca nel catalogo
  • Luca Giuliano, Gevisa La Rocca, L’analisi automatica e semi-automatica dei dati testuali Vol. I – Software e istruzioni per l’uso. Milano: LED, 2008. Cerca nel catalogo
  • Luca Giuliano, The value of words. Roma: Dipartimento di Scienze statistiche, 2014.
  • Luca Giuliano, Gevisa La Rocca, L’analisi automatica e semi-automatica dei dati testuali. Vol. II – Strategie di analisi e applicazioni. Milano: LED, 2010. Cerca nel catalogo