Questa è una vecchia versione del documento!
Indice
Algoritmi per Information Retrieval [AA293]
Docente: Paolo Ferragina
Informazioni Generali
- Impegno: 6 CFU tra teoria ed esercitazioni.
Obiettivi del corso
Studio, progetto e analisi di sistemi software efficienti ed efficaci per l’Information Retrieval nell’ambito di collezioni di documenti testuali, html e semi-strutturati (p.e. XML). Questo studio si concentrerà su tutti i componenti princiali di un moderno motore di ricerca: Crawler, Parser, Compressor, Indexer, Query resolver, Ranker. Esamineremo le soluzioni algoritmiche correntemente adottate per ciascuno di essi in maniera approfondita, valutando le loro prestazioni e i loro limiti computazionali. Discuteremo anche i fondamenti pratici e teorici per l’organizzazione e l’analisi dei sistemi di IR, con valutazione delle loro prestazioni. Infine analizzeremo numerose altre tecniche algoritmiche per il: data streaming, data compression, data indexing, data sketching, data searching, e (cenni di) text mining.
Modalità di esame
L'esame consiste di una prova scritta, contenete domande sul programma del corso, e di un colloquio di approfondimento.
Vi allego un insieme di compiti relativi a prove di anni precedenti. Alcuni quesiti potrebbero riferirsi ad argomenti non trattati quest'anno, nel caso contattatemi!