Strumenti Utente

Strumenti Sito


matematica:asd:asd_14:progetto_14

Differenze

Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.

Link a questa pagina di confronto

Prossima revisione
Revisione precedente
matematica:asd:asd_14:progetto_14 [05/06/2015 alle 04:47 (10 anni fa)] – creata Roberto Grossimatematica:asd:asd_14:progetto_14 [05/06/2015 alle 04:56 (10 anni fa)] (versione attuale) Roberto Grossi
Linea 1: Linea 1:
 ====== Progetto di ASD 2014/2015 ====== ====== Progetto di ASD 2014/2015 ======
  
-Il progetto si basa su dati presi dal mondo reale e prevede di elaborare un insieme S di alcune pagine prese da wikipedia e "ripulite" dalla formattazione (ringraziamenti a Marco Cornolti e Francesco Piccinno per aver messo a disposizione tali dati):+Il progetto si basa su file presi dal mondo reale e prevede di effettuare un'analisi sperimentale dei dati su un insieme S di alcune pagine prese da wikipedia e "ripulite" dalla formattazione (ringraziamenti a Marco Cornolti e Francesco Piccinno per aver messo a disposizione tali dati):
   * qui c'è un piccolo campione per fare le prove {{:matematica:asd:asd_14:wiki-small.zip|}};   * qui c'è un piccolo campione per fare le prove {{:matematica:asd:asd_14:wiki-small.zip|}};
   * qui c'è un campione di circa 21mila pagine per un totale di circa 100 milioni di caratteri {{:matematica:asd:asd_14:wikipedia_20k.zip|}}: più pagine si riescono a trattare, meglio è.   * qui c'è un campione di circa 21mila pagine per un totale di circa 100 milioni di caratteri {{:matematica:asd:asd_14:wikipedia_20k.zip|}}: più pagine si riescono a trattare, meglio è.
Linea 18: Linea 18:
   * data una "nuova" pagina non appartenente a S, stabilirne l'importanza utilizzando le parole importanti identificate nel punto precedente.   * data una "nuova" pagina non appartenente a S, stabilirne l'importanza utilizzando le parole importanti identificate nel punto precedente.
    
-Nello svolgimento del progetto, può essere utile vedere ogni pagina come un cammino (pesato o meno) in G e considerare i nodi di G che corrispondono alle parole importanti. Potrebbero esserci problemi di allocazione di memoria per G quando si elaborano un numero elevato di pagine: in tal caso, conviene fare più passate di lettura per costruire G un pezzo alla volta. Inoltre, conviene sempre memorizzare G utilizzando le liste di adiacenza, dove quest'ultime sono in realtà un array di array di varia lunghezza: se d(u) indica il grado di un nodo u, conviene fare una prima passata per scoprire il valore di d(u) e allocare un array di d(u) elementi per ogni nodo u, e una seconda passata per riempire tali array con la lista dei vicini. Quindi il termine "lista" va inteso in senso lato per occupare meno memoria. +Nello svolgimento del progetto, può essere utile vedere ogni pagina come un cammino (pesato o meno) in G e considerare i nodi di G che corrispondono alle parole importanti. Potrebbero esserci problemi di allocazione di memoria per G quando si elaborano un numero elevato di pagine: in tal caso, conviene fare più passate di lettura per costruire G un pezzo alla volta. Inoltre, conviene sempre memorizzare G utilizzando le liste di adiacenza, dove quest'ultime sono in realtà un array di array di varia lunghezza: se d(u) indica il grado di un nodo u, conviene fare una prima passata per scoprire il valore di d(u) e allocare un array di d(u) elementi per ogni nodo u, e una seconda passata per riempire tali array con le corrispondenti liste dei vicini. Quindi il termine "lista" va inteso in senso lato per occupare meno memoria. 
  
 Durante lo svolgimento del progetto, possono essere utili un paio di strumenti: Durante lo svolgimento del progetto, possono essere utili un paio di strumenti:
   * ''od -c'' vedi [[http://linux.about.com/library/cmd/blcmdl1_od.htm]]   * ''od -c'' vedi [[http://linux.about.com/library/cmd/blcmdl1_od.htm]]
   * ''mmap'' vedi [[matematica:asd:asd_14:mmap]] e [[http://man7.org/linux/man-pages/man2/mmap.2.html]]   * ''mmap'' vedi [[matematica:asd:asd_14:mmap]] e [[http://man7.org/linux/man-pages/man2/mmap.2.html]]
matematica/asd/asd_14/progetto_14.1433479654.txt.gz · Ultima modifica: 05/06/2015 alle 04:47 (10 anni fa) da Roberto Grossi

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki