Università degli Studi Guglielmo Marconi

Insegnamento
Sistemi per information retrieval
Docente
Prof. De Luca Ernesto William
Settore Scientifico Disciplinare
ING-INF/05
CFU
6
Descrizione dell'insegnamento

Il Corso ha l’obiettivo di introdurre le tecnologie dei sistemi di recupero automatico dell’informazione da sorgenti eterogenee e distribuite. Esso fornisce competenze nella comprensione dei processi e nelle tecniche di information processing che caratterizzano gli odierni motori di ricerca e le loro applicazioni. Nel quadro delle tecnologie informatiche, una particolare enfasi sarà data alle tecnologie dell’apprendimento automatico che consentono il rapido sviluppo di sistemi basati sul riutilizzo di dati e conoscenze disponibili in forma elettronica nelle fonti aperte. Questa linea di tendenza, denominata data e text mining, sarà discussa in relazione alle applicazioni odierne nell'ambito del Web.

Obiettivi formativi (espressi come risultati di apprendimento attesi)

Al termine di questo corso, lo studente sarà in grado di:

  • apprendere gli algoritmi e le tecnologie per il recupero automatico dell´informazione;
  • conoscere i modelli Booleani, statistici ed algebrico-vettoriali per l’IR;
  • comprendere le architetture e le componenti dei sistemi di IR;
  • analizzare l’applicazione dei sistemi di IR ai motori di ricerca su Web;
  • saper applicare l’IR al trattamento dei dati multimediali;
  • studiare elementi di Machine Learning (ML) e Data Mining per l’IR;
  • comprendere l’elaborazione dei testi, l’estrazione dell’informazione, la classificazione automatica, il Semantic IR.
Prerequisiti

Non sono richiesti requisiti specifici

Contenuti dell'insegnamento
  • Introduzione agli Algoritmi ed alle Tecnologie per il recupero automatico dell´informazione (Information Retrieval, I).
  • Modelli di IR. Modelli Booleani, statistici ed algebrico-vettoriali per l’IR.
  • Sistemi di IR: architetture e componenti.
  • IR e Web: Dai sistemi di IR ai motori di ricerca su Web. Google Page Rank.
  • Trattamento dei dati multimediali: multimedia IR.
  • Data & Text Mining: Elementi di Machine Learning (ML) e Data Mining per l’IR.
  • IR avanzato: elaborazione dei testi, estrazione dell’informazione, classificazione automatica, Semantic IR.
  • Applicazioni (approfondimento): tecnologie di IR nel Web 2.0. Meccanismi di personalizzazione, condivisione e collaborazione nel Web 2.0. Folksonomies.
Attività didattiche
Didattica Erogativa
L'insegnamento prevede, per ciascun CFU, 5 ore di Didattica Erogativa, costituite da 2,5 videolezioni (tenendo conto delle necessità di riascolto da parte dello studente). Ciascuna videolezione esplicita i propri obiettivi e argomenti, ed è corredata da materiale testuale in pdf.

Didattica Interattiva
L'insegnamento segue quanto previsto dalle Linee Guida di Ateneo sulla Didattica Interattiva e l'interazione didattica, e propone, per ciascun CFU, 1 ora di Didattica Interattiva dedicata alle seguenti attività: lettura area FAQ, partecipazione ad e-tivity strutturata costituita da attività finalizzate alla restituzione di un feedback formativo e interazioni sincrone dedicate a tale restituzione.
Criteri di valutazione
Tutte le prove di verifica e autoverifica intermedie previste dai Corsi ed erogate in modalità distance learning sono da considerarsi altamente consigliate e utili ai fini della preparazione e dello studio individuali. Le prove di verifica e autoverifica intermedie non sono obbligatorie ai fini del sostenimento della prova d´esame, la quale deve essere svolta in presenza dello studente davanti ad apposita Commissione ai sensi dell´art. 11 c.7 lett.e) del DM 270/2004.
Modalità della prova finale

L´esame si svolge in forma scritta e/o orale.

La prova scritta ha la durata massima di 120 minuti.

Libri di testo

Oltre alle lezioni realizzate dal Docente ed ai materiali didattici pubblicati in piattaforma, è obbligatorio lo studio dei seguenti testi:

  1. IR: alternativa tra:
    • Modern Information Retrieval, Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Addison Wesley, 1999. ISBN: 020139829X
    • Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Cambridge University Press. 2008.
  2. ML ed IR: Automatic Text Categorization: from Information Retrieval to Support Vector Learning, Roberto Basili, Alessandro Moschitti, ARACNE Editore, 2005.
  3. Dispense fornite dal docente

Testi di approfondimento:

  1. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data (Data-Centric Systems and Applications), Liu, Bing, Springer-Verlag, Series: Data-Centric Systems and Applications, Berlin, ISBN: 978-3-540-37881-5, 2007.
  2. Dispense e articoli scientifici forniti dal docente
Ricevimento studenti

Previo appuntamento (ew.deluca@unimarconi.it)