Indice

Data Mining A.A. 2008/09

Docenti:

News

Obiettivi del corso

La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali. L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi. Particolare enfasi è dedicata agli aspetti metodologici presentati mediante alcune classi di applicazioni paradigmatiche quali il Basket Market Analysis, la segmentazione di mercato, il rilevamento di frodi. Infine il corso introduce gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza. Il corso consiste delle seguenti parti:

  1. i concetti di base del processo di estrazione della conoscenza: studio e preparazione dei dati, forme dei dati, misure e similarità dei dati;
  2. le principali tecniche di datamining (regole associative, classificazione e clustering). Di queste tecniche si studieranno gli aspetti formali e implementativi;
  3. alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di frodi e di studi epidemiologici.
  4. l’ultima parte del corso ha l’obiettivo di introdurre gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza

Orario e Aule

Lezioni:

Ricevimento:

Libro di Testo

Riferimenti bibliografici

Calendario delle lezioni

Giorno/ora Aula Argomento Materiale didattico Docente
1. Martedì, Febbraio 24, 14-16 Aula C1 Presentazione del corso: motivazioni, classi di applicazioni dm_intro-1-2_2009.pdf Giannotti
2. Giovedì, Febbraio 26, 11-13 Aula D1 principali metodi di DM (Cap.1) idem Nanni
3. Martedì, Marzo 3, 14-16 Aula C1 I Dati: i tipi di dato, la qualità dei dati, la preparazione dei dati - Misure di similarità (Cap.2) chap2_data.pdf Giannotti
4. Giovedì, Marzo 5, 11-13 Aula D1 I Dati: Esplorazione dei dati (Cap.3) chap3_data_exploration.pdf Giannotti
5. Martedì, Marzo 10, 14-16 Aula C1 Regole Associative: concetti basici ed algoritmo A-Priori (Cap. 6: 6.1, 6.2, 6.3, 6.4, 6.7) Giannotti
6. Giovedì, Marzo 12, 11-13 Aula D1 Regole Associative: tassonomie, regole quantitative (Cap. 7: 7.1, 7.2, 7.3, 7.4) Giannotti
7. Martedì, Marzo 17, 14-16 Aula C1 Regole Associative: Pattern Sequenziali (Cap. 7: 7.1, 7.2, 7.3, 7.4) Giannotti
8. Giovedì, Marzo 19, 11-13 Aula D1 Clustering - Introduzione (Cap. 8: 8.1) chap8_basic_cluster_analysis.pdf (Slides 1-82) Nanni
9. Martedì, Marzo 24, 14-16 Aula C1 Clustering - Algoritmi k-means e gerarchici (Cap. 8: 8.2, 8.3) idem Nanni
10. Giovedì, Marzo 26, 11-13 Aula D1 Clustering - Algoritmi gerarchici e density-based (Cap. 8: 8.3, 8.4, 8.5.1) Idem Nanni
11. Martedì, Marzo 31, 14-16 Aula C1 Esercitazione di preparazione alla verifica: Regole Associative e Clustering Nanni
12. Giovedì, Aprile 2, 11-13 Aula D1 Esercitazione di preparazione alla verifica: Regole Associative e Clustering Giannotti
Martedì, Aprile 7, 11-13 Aula D1 VERIFICA
13. Martedì, Aprile 21, 14-16 Aula C1 Classificazione con alberi di decisione, Algoritmo C4.5 chap4_basic_classification.pdf Nanni
14. Giovedì, Aprile 23, 11-13 Aula D1 Classificazione Idem Nanni
15. Martedì, Aprile 28, 14-16 Aula C1 Classificazione Giannotti
16. Giovedì, Aprile 30, 11-13 Aula D1 Classificazione: esercitazione Giannotti
17. Martedì, Maggio 5, 14-16 Aula C1 Casi di studio redemption.pdf Nanni
18. Giovedì, Maggio 7, 11-13 Aula D1 Casi di studio / Strumenti di DM Giannotti
19. Martedì, Maggio 12, 14-16 Aula C1 Esercitazione di preparazione alla verifica: Classificazione Nanni
20. Giovedì, Maggio 14, 11-13 Aula D1 Casi di studio / Presentazione progetti coop_dw_abbandono.pdf Mazzoni/Nanni
21. Giovedì, Maggio 21, 11-13 Aula D1 Esercitazione di preparazione alla verifica: Classificazione Esercizio Nanni

Verifiche anni precedenti

Verifiche anni precedenti (sottoinsieme)

Verifiche 2007 (appelli giugno-luglio)

Verifiche 2008

Progetti

Software

Appelli di esame

Verifiche intermedie

Data Orario Luogo Note Voti
7 aprile 2009, martedì 11-13 Aula D1 Verifica intermedia, 7 aprile 2009: Risultati (corretti il 29 aprile '09)
28 maggio 2009, giovedì 14-16 Aula D1 Testo verifica Verifica intermedia, 28 maggio 2009: Risultati

Appelli regolari

Tipo di prova Data Orario Luogo Note Voti
Appello 1 - scritto 12 giugno 2009 10-12 D1 Appello 12 giugno 2009: Risultati
orale 16 giugno 2009 10-13 B - -
Appello 2 - scritto 30 giugno 2009 10-12 D1 Testo Appello 30 giugno 2009: Risultati
orale 7 luglio 2009 10-13 D1 - -
Appello 3 - scritto 21 luglio 2009 10-12 D1 Testo Appello 21 luglio 2009: Risultati
orale 24 luglio 2009 10-13 D1 -
Appello 4 - scritto 3 settembre 2009 10-12 C Testo Appello 3 settembre 2009: Risultati
orale 10 settembre 2009 10-12 C Confermata

Edizioni anni precedenti