WarLogs Dataset

Il dataset contiene un sottoinsieme del dataset pubblicato da WikiLeak il 22 Ottobre 2010 contenente i report di guerra in Iraq dal 2004 al 2009.

I dati sono stati già filtrati e semplificati in una tabella relazionale, i cui attributi vengono descritti di seguito:

Il dataset viene fornito in formato CSV: warlogs.csv.zip (nuova versione)
Viene fornito anche un sample del dataset contenente 2000 report estratti in modo random (distribuzione uniforme sulla report_key): warlogs2000.csv.zip

:!: A causa di un errore nella generazione del dataset integrale (warlogs.csv), è stata caricato sul wiki una versione aggiornata del file.

Problema

Si richiede una analisi dei dati forniti utilizzando i metodi di clustering forniti da Weka mettendo in relazione i diversi tipi (attributo “Type”) di attacco e le distribution di morti, feriti e nemici catturati.
Per ogni clustering effettuato è necesario fornire una motivatione/spiegazione del risultato in base al valore degli altri attributi (es. correlazione tra diversi attributi e classe di clustering).

Suggerimenti: