dm:dm.2010-11
Differenze
Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.
dm:dm.2010-11 [20/09/2011 alle 06:51 (14 anni fa)] – creata Fosca Giannotti | dm:dm.2010-11 [20/09/2011 alle 06:52 (14 anni fa)] (versione attuale) – Fosca Giannotti | ||
---|---|---|---|
Linea 1: | Linea 1: | ||
- | llllllllllllllllllllllllll | + | ====== Data Mining A.A. 2010/11 ====== |
+ | Docenti: | ||
+ | * **Dino Pedreschi, Fosca Giannotti, Mirco Nanni** | ||
+ | * KDD Laboratory, Università di Pisa ed ISTI - CNR, Pisa | ||
+ | * [[http:// | ||
+ | * [[[email protected]]] | ||
+ | * [[[email protected]]] | ||
+ | * [[[email protected]]] | ||
+ | |||
+ | Assistenti: | ||
+ | * **Anna Monreale, Salvo Rinzivillo, Diego Pennacchioli** | ||
+ | * KDD Laboratory, Università di Pisa ed ISTI - CNR, Pisa | ||
+ | * [[http:// | ||
+ | * [[[email protected]]] | ||
+ | * [[[email protected]]] | ||
+ | * [[[email protected]]] | ||
+ | ====== News ====== | ||
+ | * [28/ | ||
+ | * [11/ | ||
+ | * [21/ | ||
+ | * [26/ | ||
+ | * [26/ | ||
+ | * [24/ | ||
+ | * [21/ | ||
+ | * [17/ | ||
+ | * [01/ | ||
+ | * [23/ | ||
+ | * [23/ | ||
+ | * [15/ | ||
+ | * [15/ | ||
+ | |||
+ | ====== Obiettivi del corso ====== | ||
+ | |||
+ | La grande disponibilità di dati provenienti da database relazionali, | ||
+ | - i concetti di base del processo di estrazione della conoscenza: studio e preparazione dei dati, forme dei dati, misure e similarità dei dati; | ||
+ | - le principali tecniche di datamining (regole associative, | ||
+ | - alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di frodi e di studi epidemiologici. | ||
+ | - l’ultima parte del corso ha l’obiettivo di introdurre gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza | ||
+ | |||
+ | ====== Orario e Aule ====== | ||
+ | **Lezioni: | ||
+ | |||
+ | ^ Giorno | ||
+ | | Lunedì | 14:00 - 16:00 | N | valido a partire dal 28.03.2011 | | ||
+ | | Mercoledì | 14:00 - 16:00 | C1 | | | ||
+ | | Venerdì | 09:00 - 11:00 | B1 | valido fino al 25.03.2011 | | ||
+ | |||
+ | **Ricevimento: | ||
+ | * su appuntamento con i docenti c/o ISTI-CNR | ||
+ | |||
+ | ====== Materiale didattico ====== | ||
+ | |||
+ | ===== Libro di Testo ===== | ||
+ | |||
+ | * Pang-Ning Tan, Michael Steinbach, Vipin Kumar. **Introduction to Data Mining**. Addison Wesley, ISBN 0-321-32136-7, | ||
+ | * [[http:// | ||
+ | |||
+ | ===== Slides del corso ===== | ||
+ | |||
+ | * Le slide utilizzate durante il corso verranno inserite nel calendario al termine di ogni lezione. In buona parte esse sono tratte da quelle fornite dagli autori del libro di testo: [[http:// | ||
+ | |||
+ | ===== Testi di esame ===== | ||
+ | |||
+ | * Oltre ai testi e (dove disponibili) soluzioni degli appelli d' | ||
+ | * {{tdm: | ||
+ | * {{dm: | ||
+ | * {{: | ||
+ | |||
+ | ====== Calendario delle lezioni ====== | ||
+ | |||
+ | **Prima parte del corso** | ||
+ | |||
+ | ^ ^ Giorno/ora ^ Aula ^ Argomento ^ Materiale didattico ^ Docente ^ | ||
+ | |1.| 19.10.2010 11:00-13:00 | L1 | Introduzione: | ||
+ | |2.| 22.10.2010 08:30-10:00 | B1 | Overview delle tecniche di data mining | | Giannotti | | ||
+ | |3.| 26.10.2010 11:00-13:00 | L1 | Dati: tipi e misure di base | Cap. 2 del libro di testo {{: | ||
+ | |4.| 29.10.2010 08:30-10:00 | B1 | Dati: tipi e misure di base | | Pedreschi | ||
+ | |5.| 02.11.2010 11:00-13:00 | L1 | Analisi esplorativa e data understanding | Cap. 3 del libro di testo {{: | ||
+ | |6.| 05.11.2010 08:30-10:00 | B1 | Analisi esplorativa e data understanding | | Pedreschi | ||
+ | |7.| 10.11.2010 14:00-16:00 | G1 | Esercitazione con il sistema Weka | [[http:// | ||
+ | |8.| 17.11.2010 14:00-16:00 | G1 | cancellata per sciopero del docente | | Pedreschi | ||
+ | |9.| 19.11.2010 08:30-10:00 | B1 | Analisi di clustering. K-means | Cap. 8 del libro di testo {{: | ||
+ | |10.| 24.11.2010 14:00-16:00 | G1 | cancellata per occupazione studentesca | | Pedreschi | ||
+ | |11.| 26.11.2010 09:00-11:00 | B1 | cancellata per occupazione studentesca | | Pedreschi | ||
+ | |12.| 01.12.2010 14:00-16:00 | G1 | cancellata per occupazione studentesca | | Pedreschi | ||
+ | |13.| 03.12.2010 09:00-11:00 | B1 | Analisi di clustering. Metodi gerarchici | | Pedreschi | ||
+ | |14.| 08.12.2010 14:00-16:00 | G1 | festività | | | | ||
+ | |15.| 11.12.2010 09:00-11:00 | B1 | Analisi di clustering. Metodi basati su densità | | Pedreschi | ||
+ | |16.| 15.12.2010 14:00-16:00 | G1 | Esercitazione con il sistema Weka | | Pedreschi | ||
+ | |17.| 17.12.2010 09:00-11:00 | B1 | Classificazione. Alberi di decisione | Cap. 4 del libro di testo {{: | ||
+ | |18.| 12.01.2011 14:00-16:00 | G1 | Classificazione. Alberi di decisione | | Pedreschi | ||
+ | |19.| 14.01.2011 09:00-11:00 | B1 | Classificazione. Alberi di decisione | | Pedreschi | ||
+ | |20.| 19.01.2011 14:00-16:00 | G1 | Esercitazione con il sistema Weka | | Pedreschi | ||
+ | |21.| 21.01.2011 09:00-11:00 | B1 | Esercitazione con il sistema Weka | | Pedreschi | ||
+ | |||
+ | **Seconda parte del corso** | ||
+ | |||
+ | ^ ^ Giorno ^ Ora ^ Aula ^ Argomento ^ Materiale didattico ^ Docente ^ | ||
+ | |1.|09.03.2011|14: | ||
+ | |2.|16.03.2011|14: | ||
+ | |3.|18.03.2011|09: | ||
+ | |4.|23.03.2011|14: | ||
+ | |5.|25.03.2011|09: | ||
+ | |6.|28.03.2011|14: | ||
+ | |7.|30.03.2011|14: | ||
+ | |8.|04.04.2011|14: | ||
+ | |9.|06.04.2011|14: | ||
+ | |10.|11.04.2011|14: | ||
+ | |11.|13.04.2011|14: | ||
+ | |12.|02.05.2011|14: | ||
+ | |13.|04.05.2011|14: | ||
+ | |14.|09.05.2011|14: | ||
+ | |15.|11.05.2011|14: | ||
+ | |16.|16.05.2011|14: | ||
+ | |17.|18.05.2011|14: | ||
+ | | |23.05.2011|14: | ||
+ | |18.|25.05.2011|14: | ||
+ | |19.|30.05.2011|14: | ||
+ | |20.|01.06.2011|14: | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ====== Modalità di esame ====== | ||
+ | |||
+ | L' | ||
+ | * La **prova scritta** è composta essenzialmente di esercizi sui metodi e algoritmi visti a lezione. I testi degli appelli d' | ||
+ | * La **prova orale** verte sugli aspetti più teorici del corso (definizioni, | ||
+ | |||
+ | ====== Esercizi 2010-2011 ====== | ||
+ | |||
+ | |||
+ | ===== Esercizi DM parte I ===== | ||
+ | - ** Comprensione dei dati: Adult dataset. Assegnato il 19.11.2010. Da completarsi entro il 30.11.2010. Consegnare per email al docente, cc a [[[email protected]]] specificando [DM] nel subject della mail. ** Considerare il dataset Adult, scaricabile dall' | ||
+ | - ** Analisi di clustering: WarLogs dataset. Assegnato il 17.12.2010. Da completarsi entro il 10.01.2011. Consegnare per email al docente, cc a [[[email protected]]] specificando [DM] nel subject della mail. ** Testo e dataset sono scaricabili [[ warlogs | a questa pagina]] | ||
+ | - ** Classificazione: | ||
+ | |||
+ | ===== Esercizi DM parte II ===== | ||
+ | Dati e dettagli delle esercitazioni possono essere richiesti scrivendo a [[[email protected]]]. | ||
+ | Nota: i gruppi di progetto possono essere composti fino a 3 persone. | ||
+ | - **Progetto “Rilevazione rischio frode fiscale”**. Consegna finale scaduta. | ||
+ | - **Progetto “Market Basket Analysis”**. Consegna finale: fine maggio 2011. | ||
+ | - **Progetto “Mobility Data Analysis”**. Consegna finale: fine giugno 2011. | ||
+ | ====== Appelli di esame ====== | ||
+ | |||
+ | ===== Verifiche intermedie/ | ||
+ | |||
+ | ^ ^ Data ^ Orario ^ Luogo ^ Note ^ Voti ^ | ||
+ | |I Esercizio e II Esercizio | 30.11.2010 | | | | [[dm: | ||
+ | |||
+ | ===== Appelli regolari ===== | ||
+ | |||
+ | ^ Appello ^ Data ^ Orario | ||
+ | | |07 Febbraio 2011 | 9.00 -- 13.00 |Aula L1 | | | | ||
+ | | |03 Marzo 2011 | 9.00 -- 13.00 |Aula C | ||
+ | | |15 Giugno 2011 | 9.00-12.00 | ||
+ | | | ||
+ | | |27 Giugno 2011 | 9.00 |Aula C1 | ||
+ | | |18 Luglio 2011 | 9.00 |Aula B | ||
+ | | | ||
+ | |||
+ | ====== Edizioni anni precedenti ===== | ||
+ | |||
+ | * [[dm.2009-10]] | ||
+ | * [[dm.2008-09]] | ||
+ | * [[dm.2007-08]] | ||
+ | * [[dm.2006-07]] | ||
+ | * [[PhDWorkshop2011]] | ||
+ | * [[SNA.Ingegneria2011]] |
dm/dm.2010-11.1316501469.txt.gz · Ultima modifica: 20/09/2011 alle 06:51 (14 anni fa) da Fosca Giannotti