matematica:asd:asd_23:progetto_21
Differenze
Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.
Entrambe le parti precedenti la revisioneRevisione precedenteProssima revisione | Revisione precedente | ||
matematica:asd:asd_23:progetto_21 [18/05/2024 alle 02:37 (10 mesi fa)] – Roberto Grossi | matematica:asd:asd_23:progetto_21 [03/10/2024 alle 13:11 (5 mesi fa)] (versione attuale) – Roberto Grossi | ||
---|---|---|---|
Linea 1: | Linea 1: | ||
- | ====== Progetto | + | ====== Progetto |
- | Il progetto riguarda la costruzione e l' | + | Il progetto riguarda la costruzione e l' |
{{: | {{: | ||
Linea 8: | Linea 8: | ||
I. **Lettura e Creazione del Grafo:** | I. **Lettura e Creazione del Grafo:** | ||
- | * Leggere un file GFA e creare un grafo etichettato e orientato, utilizzando le liste di adiacenza (vector in C++). | + | * Leggere un file GFA e creare un grafo \(G\) etichettato e orientato, utilizzando le liste di adiacenza (vector in C++). |
- | * Etichettare i nodi e gli archi del grafo in base alle informazioni fornite nel file GFA. | + | * Etichettare i nodi e gli archi di \(G\) in base alle informazioni fornite nel file GFA. |
- | II. **Analisi | + | II. **Analisi |
- | * Considerare | + | * Verificare se il grafo \(G\) sia ciclico: in tal caso effettuare una visita DFS e rimuovere gli archi all' |
- | | + | * Considerare una sorgente |
- | III. **Ricerca di Cammini | + | III. **Ricerca di Pattern sui Cammini |
- | | + | |
- | * Ignorare l' | + | * Attenzione che il numero di tali cammini può essere esponenziale, |
- | * Modificare | + | * Ignorare l' |
- | + | * Data una sequenza pattern \( P \) di lunghezza \( K \), verificare se è contenuta in una delle sequenze generate | |
- | IV. **Verifica di Pattern nella Sequenza:** | + | |
- | * Data una sequenza pattern \( P \) di lunghezza \( K \), verificare se è contenuta in una delle sequenze generate | + | |
* Utilizzare tecniche di rolling hash per calcolare l'hash delle porzioni di lunghezza \( K \) nella sequenza (hash visto a lezione) e confrontarle con l'hash del pattern \( P \). | * Utilizzare tecniche di rolling hash per calcolare l'hash delle porzioni di lunghezza \( K \) nella sequenza (hash visto a lezione) e confrontarle con l'hash del pattern \( P \). | ||
- | V. **Calcolo delle Frequenze dei K-mer:** | + | V. **Facoltativo: |
- | | + | |
- | * Calcolare la frequenza di ogni K-mer e il numero delle sue occorrenze. Ad esempio, per \( P = ATA \), la frequenza | + | |
* Riportare i 10 K-mer più frequenti in \( G \). | * Riportare i 10 K-mer più frequenti in \( G \). | ||
Linea 36: | Linea 33: | ||
* **L (Link):** Linee che descrivono collegamenti tra segmenti. | * **L (Link):** Linee che descrivono collegamenti tra segmenti. | ||
* **P (Path):** Linee che descrivono cammini attraverso segmenti. | * **P (Path):** Linee che descrivono cammini attraverso segmenti. | ||
- | * **L (Walk):** Linee che descrivono cammini attraverso segmenti. | + | * **L (Walk):** Linee che descrivono cammini attraverso segmenti |
Utilizzare solo S per i nodi e L per gli archi. | Utilizzare solo S per i nodi e L per gli archi. | ||
Linea 42: | Linea 39: | ||
Consideriamo un grafo con i seguenti nodi e archi rappresentati in formato GFA: | Consideriamo un grafo con i seguenti nodi e archi rappresentati in formato GFA: | ||
- | ``` | + | |
+ | < | ||
H VN:Z:1.0 | H VN:Z:1.0 | ||
S s11 GAT | S s11 GAT | ||
Linea 63: | Linea 61: | ||
W sample 1 A 0 10 > | W sample 1 A 0 10 > | ||
W sample 2 A 0 10 > | W sample 2 A 0 10 > | ||
- | ``` | + | </ |
- | In questo grafo, analizziamo i cammini possibili e verifichiamo se il pattern \( P = TTCA \) è presente in una delle sequenze ottenute. | + | |
- | **Conclusioni** | + | In questo grafo \( G \), analizziamo i cammini possibili e verifichiamo se il pattern \( P = TTCA \) è presente in una delle sequenze ottenute. |
+ | |||
+ | {{: | ||
- | Questo progetto permette di comprendere e applicare tecniche avanzate di bioinformatica per l' | ||
**Riferimenti** | **Riferimenti** | ||
- | - Documentazione del formato GFA | + | * Spiegazioni video dettagliate del progetto: [[https:// |
- | - Data set | + | * Documentazione del formato GFA: [[http:// |
- | - Canale Team per maggiori info | + | * Data set: [[https:// |
matematica/asd/asd_23/progetto_21.1715999853.txt.gz · Ultima modifica: 18/05/2024 alle 02:37 (10 mesi fa) da Roberto Grossi