Docenti:
Il Web è diventato con il passare degli anni il più grande repository di dati esistente, con stime recenti di più di 500 miliardi di documenti online. Blog, Wiki, Pagine Web “Classiche”, sono solo alcuni esempi di cosa oggi contenga il Web. La dimensione partecipativa del cosiddetto Web 2.0 rende questo fenomeno ancora più complesso, amplificando la possibilità di relazione fra persone attraverso la proiezione online delle relazioni sociali ed economiche - il social networking.
Lo scopo di questo corso è mostrare alcune tra le più importanti metodologie di analisi dei dati provenienti dal Web: dati relativi al contenuto delle risorse Web, alla struttura di link fra le risorse, all'uso e all'accesso alle risorse da parte degli utenti, ed infine alle reti (grafi) di relazioni fra soggetti che usano gli strumenti di social networking del Web 2.0.
Dopo una breve introduzione che ricapitola le tecniche di base per l’analisi ed il mining dei dati Web, saranno affrontati e discussi i seguenti argomenti:
Web mining link a Wikipedia:
Reti sociali link a Wikipedia:
Giorno | Argomento | Lucidi | Docente | |
---|---|---|---|---|
1. | Mer 24.09.2008 | Introduzione al Web Mining | Silvestri | |
2. | Lun 29.09.2008 | Webgraph & its Models | Silvestri | |
3. | Mer 01.10.2008 | Clustering and Classification | Silvestri | |
4. | Lun 06.10.2008 | Introduzione all'analisi delle reti sociali | Pedreschi | |
5. | Mer 08.10.2008 | Annullata per assemblea | Silvestri | |
6. | Lun 13.10.2008 | Log Analysis | Silvestri | |
7. | Mer 15.10.2008 | Sospensione generale della didattica | Pedreschi | |
8. | Lun 20.10.2008 | Silvestri | ||
9. | Mer 22.10.2008 | Silvestri | ||
10. | Lun 27.10.2008 | Proprietà analitiche delle reti | Pedreschi | |
11. | Mer 29.10.2008 | Richiami di statistica | Pedreschi | |
12. | Lun 03.11.2008 | Sospensione per Compitini | Silvestri | |
13. | Mer 05.11.2008 | Sospensione per Compitini | Silvestri | |
14. | Lun 10.11.2008 | Applicazioni Di Log Analysis | Silvestri | |
15. | Mer 12.11.2008 | Modelli di generazione delle reti - random graph - LEZIONE IN PIAZZA | Pedreschi | |
16. | Lun 17.11.2008 | Smart Document Partitioning for Web Search | Silvestri | |
17. | Mar 19.11.2008 | Multimedia Caching | dr. Claudio Lucchese (Silvestri) | |
18. | Lun 24.11.2008 | Silvestri | ||
19. | Mer 26.11.2008 | Silvestri | ||
20. | Lun 01.12.2008 | Modelli di generazione delle reti - small-world model | Pedreschi | |
21. | Mer 03.12.2008 | Modelli di generazione delle reti - power-law model | Pedreschi | |
22. | Mar 09.12.2008 | Graph-mining ed analisi delle reti | Pedreschi | |
23. | Mer 10.12.2008 | Demo su sistemi per l'analisi di reti | Dr. Michele Coscia (Pedreschi) |
Sono previste tre possibili modalità di esame:
In ogni caso, è prevista la redazione di un testo a documentazione del lavoro svolto, e la presentazione dello stesso in una seduta pubblica, alla presenza degli studenti del corso e dei ricercatori dei gruppi di ricerca KDD LAB ed HPC LAB dell'ISTI-CNR. La valutazione terrà conto sia del documento preparato che della presentazione. Ogni progetto/rassegna potrà essere svolto individualmente o a gruppi di due studenti. Il contenuto di ogni progetto/rassegna dovrà essere concordato preventivamente con il docente.