Docenti:
Assistenti:
La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali. L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi. Particolare enfasi è dedicata agli aspetti metodologici presentati mediante alcune classi di applicazioni paradigmatiche quali il Basket Market Analysis, la segmentazione di mercato, il rilevamento di frodi. Infine il corso introduce gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza. Il corso consiste delle seguenti parti:
Lezioni:
Giorno | Orario | Aula |
---|---|---|
Mercoledì | 14:00 - 16:00 | primo semestre: L1, secondo semestre: I1 |
Venerdì | 09:00 - 11:00 | primo semestre: B1, secondo semestre: I1 |
Ricevimento:
Prima parte del corso, primo semestre
Giorno/ora | Aula | Argomento | Materiale didattico | Docente | |
---|---|---|---|---|---|
1. | 28.09.2011 14:00-16:00 | L1 | Introduzione: il knowledge discovery process | Cap. 1 del libro di testo dm_intro-2011.pdf | Pedreschi |
2. | 05.10.2011 14:00-16:00 | L1 | Open week: lezione speciale su Big Data Mining | Pedreschi | |
3. | 07.10.2011 14:00-16:00 | L1 | Overview delle tecniche di data mining | Pedreschi | |
4. | 12.10.2011 14:00-16:00 | L1 | Dati: tipi e misure di base | Cap. 2 del libro di testo chap2_data_new.pdf | Pedreschi |
5. | 14.10.2011 09:00-11:00 | B1 | Dati: tipi e misure di base | Pedreschi | |
6. | 19.11.2011 14:00-16:00 | L1 | Cancellata per impegno istituzionale del docente. | Pedreschi | |
7. | 21.10.2011 09:00-11:00 | B1 | Cancellata per impegno istituzionale del docente. | Pedreschi | |
8. | 26.10.2011 14:00-16:00 | L1 | Analisi esplorativa e data understanding. Esercitazione con il sistema Weka | Weka Cap. 3 del libro di testo chap3_data_exploration.pdf | Pedreschi |
9. | 28.10.2011 09:00-11:00 | B1 | Analisi esplorativa e data understanding. Esercitazione con il sistema Weka | Pedreschi | |
10. | 09.11.2011 14:00-16:00 | Aula Sem. Est | Seminario di cultura digitale: Social Data Science | Pedreschi | |
11. | 11.11.2011 09:00-11:00 | B1 | Analisi di clustering. K-means e metodi gerarchici | Cap. 8 del libro di testo chap8_basic_cluster_analysis.pdf | Pedreschi |
12. | 16.11.2011 14:00-16:00 | L1 | Analisi di clustering. Metodi basati su densità | Pedreschi | |
13. | 18.11.2011 09:00-11:00 | B1 | Esercitazione con il sistema Weka - Clustering | Pedreschi | |
14. | 23.11.2011 14:00-16:00 | L1 | Classificazione. Alberi di decisione | Cap. 4 del libro di testo chap4_basic_classification.pdf | Pedreschi |
15. | 25.11.2011 09:00-11:00 | B1 | Classificazione. Alberi di decisione | Pedreschi | |
16. | 30.11.2011 14:00-16:00 | L1 | Classificazione. Metodi a regole e bayesiani | Pedreschi | |
17. | 02.12.2011 09:00-11:00 | B1 | Esercitazione con il sistema Weka | Pedreschi | |
18. | 07.12.2011 14:00-16:00 | L1 | Cancellata per impegno istituzionale del docente. | Pedreschi | |
19. | 09.12.2011 09:00-11:00 | B1 | Cancellata per impegno istituzionale del docente. | Pedreschi | |
20. | 14.12.2011 14:00-16:00 | L1 | Esercitazione con il sistema Weka - Classificazione | Pedreschi | |
21. | 16.12.2011 09:00-11:00 | B1 | Esercitazione con il sistema Weka - Classificazione | Pedreschi | |
22. | 19.12.2011 14:00-16:00 | TBD | Ricevimento collettivo | Pedreschi |
Seconda parte del corso, secondo semestre
Giorno/ora | Aula | Argomento | Materiale didattico | Docente | |
---|---|---|---|---|---|
1. | 22.02.2012 14:00-16:00 | I1 | Introduzione | Intro - Slides | Giannotti |
2. | 24.02.2012 09:00-11:00 | I1 | Pattern frequenti e Regole associative / 1 | Regole Associative - Slides [sezioni 6.1-6.3] | Giannotti |
3. | 29.02.2012 14:00-16:00 | I1 | Pattern frequenti e Regole associative / 2 | [sezioni 7.1-7.3] | Giannotti |
4. | 02.03.2012 09:00-11:00 | I1 | Pattern sequenziali / 1 | Pattern Sequenziali - Slides | Nanni |
5. | 07.03.2012 14:00-16:00 | I1 | Pattern sequenziali / 2 | Tools x Patt. Seq. - Slides | Nanni |
6. | 09.03.2012 09:00-11:00 | I1 | Time series e Motif | Time Series - Slides [pp.1-25] | Nanni |
7. | 14.03.2012 14:00-16:00 | I1 | Pattern frequenti e Regole associative /3 | Giannotti | |
8. | 16.03.2012 09:00-11:00 | I1 | Time series e Motif | Time Series - Slides [pp.25-84] | Nanni |
9. | 21.03.2012 14:00-16:00 | I1 | Pattern frequenti e Regole associative, Valutazione Classificatori | Esercitazione | Giannotti e Pedreschi |
10. | 23.03.2012 09:00-11:00 | I1 | Case study: Data Mining per la Fraud detection | dm2-fraudedetection1.ppt.pdf 4.dm2-frauddetection2-diva.ppt.pdf survey-datamining_frauddetection.pdf | Giannotti |
11. | 28.03.2012 14:00-16:00 | I1 | Case study: Data Mining per il CRM / 1 | Intro al CRM e Intro alla Churn Analysis | Nanni |
30.03.2012 09:00-11:00 | I1 | Annullata per sospensione della didattica | |||
12. | 13.04.2012 09:00-11:00 | I1 | Case study: Data Mining per il CRM / 2 | Churn Analysis e Analisi eventi collettivi | Nanni |
13. | 27.04.2012 09:00-11:00 | I1 | Fenomeni di diffusione e viralità | dm2_informtion_diffusion.pdf | Giannotti |
14. | 02.05.2012 14:00-16:00 | I1 | Privacy | privacy_lezione14-16.ppt.pdf e capprivacy.pdf | Giannotti |
15. | 04.05.2012 09:00-11:00 | I1 | Mobility Data Mining/1 | Mobility Data Mining - Slides [pp.1-56] | Nanni |
16. | 09.05.2012 14:00-16:00 | I1 | Privacy + Presentazione progetto Fraud detection | economist-2012-dm.pdf e newdealondata.pdf | Giannotti |
17. | 11.05.2012 09:00-11:00 | I1 | Mobility Data Mining/2 | Mobility Data Mining - Slides [pp.57-83] | Nanni |
18. | 16.05.2012 14:00-16:00 | I1 | Presentazione progetto Market basket + introduzione piattaforma di DM | Pennacchioli | |
19. | 18.05.2012 09:00-11:00 | I1 | Case study: Mining della mobilità urbana e della mobilità sistematica | Case study MDM - Slides | Nanni |
20. | 23.05.2012 14:00-16:00 | I1 | Web usage mining e E-commerce | Web Usage Mining - Slides | Nanni |
L'esame consiste in una prova scritta ed in una prova orale:
L'esame consta di due parti:
Voti delle due esercitazioni: esercitazioni_dm2_2012_voti.pdf
Data | Orario | Luogo | Note | Voti | |
---|---|---|---|---|---|
I Esercizio e II Esercizio |
Appello | Data | Orario | Luogo | Note | Voti |
---|---|---|---|---|---|
1 | 16.01.2012 | 09:00 | Aula B1 | Risultati scritto del 16.01.2012 | |
2 | 13.03.2012 | 09:00 | Aula B1 | ||
3 | 08.06.2012 | 09:30 | Aula I1 | ||
4 | 29.06.2012 | 09:30 | Aula I1 | ||
5 | 20.07.2012 | 10:00 | Aula I1 | ||
6 | Settembre 2012 | Su appuntamento |