Indice

Web Mining ed Analisi delle Reti Sociali 2008-2009

Docenti:

Novità

Obiettivi

Il Web è diventato con il passare degli anni il più grande repository di dati esistente, con stime recenti di più di 500 miliardi di documenti online. Blog, Wiki, Pagine Web “Classiche”, sono solo alcuni esempi di cosa oggi contenga il Web. La dimensione partecipativa del cosiddetto Web 2.0 rende questo fenomeno ancora più complesso, amplificando la possibilità di relazione fra persone attraverso la proiezione online delle relazioni sociali ed economiche - il social networking.

Lo scopo di questo corso è mostrare alcune tra le più importanti metodologie di analisi dei dati provenienti dal Web: dati relativi al contenuto delle risorse Web, alla struttura di link fra le risorse, all'uso e all'accesso alle risorse da parte degli utenti, ed infine alle reti (grafi) di relazioni fra soggetti che usano gli strumenti di social networking del Web 2.0.

Dopo una breve introduzione che ricapitola le tecniche di base per l’analisi ed il mining dei dati Web, saranno affrontati e discussi i seguenti argomenti:

Web mining link a Wikipedia:

Reti sociali link a Wikipedia:

Orario delle lezioni

Materiale didattico

Calendario delle lezioni

Giorno Argomento Lucidi Docente
1. Mer 24.09.2008 Introduzione al Web Mining pdf Silvestri
2. Lun 29.09.2008 Webgraph & its Models pdf Silvestri
3. Mer 01.10.2008 Clustering and Classification pdf Silvestri
4. Lun 06.10.2008 Introduzione all'analisi delle reti sociali pdf Pedreschi
5. Mer 08.10.2008 Annullata per assemblea Silvestri
6. Lun 13.10.2008 Log Analysis pdf Silvestri
7. Mer 15.10.2008 Sospensione generale della didattica Pedreschi
8. Lun 20.10.2008 Silvestri
9. Mer 22.10.2008 Silvestri
10. Lun 27.10.2008 Proprietà analitiche delle reti pdf Pedreschi
11. Mer 29.10.2008 Richiami di statistica pdf Pedreschi
12. Lun 03.11.2008 Sospensione per Compitini Silvestri
13. Mer 05.11.2008 Sospensione per Compitini Silvestri
14. Lun 10.11.2008 Applicazioni Di Log Analysis pdf Silvestri
15. Mer 12.11.2008 Modelli di generazione delle reti - random graph - LEZIONE IN PIAZZA pdf Pedreschi
16. Lun 17.11.2008 Smart Document Partitioning for Web Search pdf Silvestri
17. Mar 19.11.2008 Multimedia Caching dr. Claudio Lucchese (Silvestri)
18. Lun 24.11.2008 Silvestri
19. Mer 26.11.2008 Silvestri
20. Lun 01.12.2008 Modelli di generazione delle reti - small-world model Pedreschi
21. Mer 03.12.2008 Modelli di generazione delle reti - power-law model Pedreschi
22. Mar 09.12.2008 Graph-mining ed analisi delle reti pdf Pedreschi
23. Mer 10.12.2008 Demo su sistemi per l'analisi di reti Dr. Michele Coscia (Pedreschi)

Modalità di esame

Sono previste tre possibili modalità di esame:

In ogni caso, è prevista la redazione di un testo a documentazione del lavoro svolto, e la presentazione dello stesso in una seduta pubblica, alla presenza degli studenti del corso e dei ricercatori dei gruppi di ricerca KDD LAB ed HPC LAB dell'ISTI-CNR. La valutazione terrà conto sia del documento preparato che della presentazione. Ogni progetto/rassegna potrà essere svolto individualmente o a gruppi di due studenti. Il contenuto di ogni progetto/rassegna dovrà essere concordato preventivamente con il docente.

Appelli di esame