Strumenti Utente

Strumenti Sito


dm:warlogs2013-14

Differenze

Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.

Link a questa pagina di confronto

Prossima revisione
Revisione precedente
dm:warlogs2013-14 [19/12/2013 alle 10:50 (11 anni fa)] – creata Mirco Nannidm:warlogs2013-14 [20/12/2013 alle 00:23 (11 anni fa)] (versione attuale) Fosca Giannotti
Linea 23: Linea 23:
  
 The dataset is in CVS format: {{:dm:warlogs.csv.zip| warlogs.csv.zip}}\\ The dataset is in CVS format: {{:dm:warlogs.csv.zip| warlogs.csv.zip}}\\
-Here is also a small sample of data (2000 reports): {{:dm:warlogs2000.csv.zip|}} \\ 
  
- 
- 
-===== Problem ===== 
-The exercise requires to perform two clusterings on the dataset: 
-  * group events based on the impact on the population and on the forces involved (casualties, captured or wounded units, etc.) 
-  * group events based on location, in order to discover geografical areas where events are more dense. Optionally, the temporal dimension can be involved in the process (e.g. to split the dataset or as additional attribute in the clustering) 
- 
-The content of each cluster.  
-Si richiede una analisi dei dati forniti utilizzando i metodi di clustering forniti da Weka mettendo in relazione i diversi tipi (attributo "Type") di attacco e le distribution di morti, feriti e nemici catturati. \\ 
-Per ogni clustering effettuato è necesario fornire una motivatione/spiegazione del risultato in base al valore degli altri attributi (es. correlazione tra diversi attributi e classe di clustering). 
- 
-Suggerimenti: 
-  * I termini di alcuni attributi possono contenere alcuni errori/ripetizioni (al momento non viene rivelato quali sono questi attributi). Verificare se questi errori emergono all'interno del clustering 
-  * Alcuni attributi hanno un ruolo di classe (ad esempio, l'attributo "region"). Verificare che la correlazione con gli attributi "st_x" e "st_y" sia valida. 
-  * Provare a selezionare sottoinsiemi di attributi per eseguire clustering separati  
-  * Una volta determinato un clustering del dataset, è possibile selezionare uno dei cluster come un dataset separato per eseguire ulteriori analisi solo sul gruppo scelto? (è necessario l'uso di filtri esterni a Weka) 
  
  
dm/warlogs2013-14.1387450245.txt.gz · Ultima modifica: 19/12/2013 alle 10:50 (11 anni fa) da Mirco Nanni

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki