Questo è il comando anfo-tool che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
anfo-tool - elabora i file binari ANFO nativi
SINOSSI
strumento informativo [ opzione | modello ... ]
DESCRIZIONE
strumento informativo viene utilizzato per filtrare, elaborare e convertire i file creati da anfoOgni modello
sulla riga di comando viene espanso il carattere jolly, quindi per ogni file di input (o lo standard
input, se non viene fornito alcun modello), strumento informativo costruisce una catena di filtri di input, quindi si fonde
questi flussi di input in uno dei diversi modi, dividono il risultato in più output
flussi, a ciascuno dei quali può essere applicata una catena di filtri di output.
VERSIONI
Informazioni Opzioni
Queste opzioni si applicano globalmente e modificano il comportamento dell'intero programma. Possono essere
posizionato ovunque nella riga di comando.
-V, --versione
Stampa il numero della versione ed esci.
-q, --silenzioso
Sopprimi tutti gli output tranne i messaggi di errore fatali.
-v, --verboso
Produrre più output, compresi indicatori di avanzamento per la maggior parte delle operazioni.
- debug
Produrre output di debug oltre alle informazioni sui progressi.
-n, --funzionamento a secco
Analizza la riga di comando, facoltativamente stampa una descrizione delle operazioni previste, quindi
Uscita.
--vmem X
Limita la memoria virtuale a X megabyte. Se la memoria si esaurisce, strumento informativo cerca di liberare
aumentare la memoria dimenticando i file di grandi dimensioni, ad esempio i genomi. Utilizzare questa opzione per evitare
condizioni di scambio o di memoria esaurita quando le operazioni coinvolgono grandi o multiple
genomi.
Configurazione Scheda Sintetica
Un parametro può essere impostato più volte sulla riga di comando e sovrascriverà quello precedente
impostazioni. Qualsiasi opzione di filtro che necessita di un parametro raccoglie l'ultima definizione che
apparso prima dell'opzione filtro.
--imposta pendenza S
Imposta il parametro pendenza su S. pendenza viene utilizzato insieme al intercettare where
i filtri si applicano ai punteggi di allineamento; allineamenti con punteggi non peggiori di pendenza * (Lunghezza
- intercettare) sono considerati buoni. Il valore predefinito è 7.5.
--set-intercetta L
Imposta il parametro di intercettazione su L. intercettare viene utilizzato insieme al pendenza
dove i filtri si applicano ai punteggi di allineamento; allineamenti che non hanno un punteggio peggiore di pendenza *
(Lunghezza - intercettare) sono considerati buoni. Il valore predefinito è 20.
--set-context C
Imposta il parametro di contesto su CIl contesto è il numero di basi circostanti di
il riferimento incluso quando si stampano gli allineamenti in formato testo. Il valore predefinito è 0.
--set-genoma G
Imposta il parametro del genoma su GMolti filtri considereranno solo i migliori allineamenti
a questo genoma specifico se è impostato. Se non è impostato alcun genoma, il migliore a livello globale
viene utilizzato l'allineamento.
--clear-genome
Cancella il parametro del genoma. I filtri si applicano all'allineamento migliore a livello globale
successivamente.
Filtra Opzioni
I filtri possono essere applicati prima di unire gli input o dopo aver suddiviso il backup.
-s, --sort-pos=n
Ordina per posizione di allineamento durante il buffering non più di n MiB in memoria. Se un
Una volta impostato il genoma, vengono utilizzati gli allineamenti a quel genoma.
-S, --sort-name=n
Ordina per nome letto durante il buffering non più di n MiB in memoria.
-l, --filter-length=L
Conservare gli allineamenti solo per letture di almeno L lunghezza delle basi. Le letture stesse
sono tenuti.
-f, --filter-score
Mantenere gli allineamenti solo se il loro punteggio è sufficientemente buono. si utilizzapendenzaeintercettare.
--filter-mapq=Q
Rimuovi gli allineamenti con la qualità di mappatura sottostante Q.
-h, --filter-hit=SEQ
Conserva solo le letture che hanno un riscontro in una sequenza denominata SEQ. Se SEQ è vuoto, legge
vengono mantenuti se hanno qualche colpo. Se il genoma il parametro è impostato, solo gli accessi a quello
conteggio del genoma.
--delete-hit=SEQ
Elimina gli allineamenti in SEQ. Se SEQ è vuoto, tutti gli allineamenti vengono eliminati. Se il
genoma Una volta impostato il parametro, vengono eliminati solo gli allineamenti a quel genoma.
--filter-qual=Q
Mascherare le basi con la qualità sottostante QTale base è sostituita dalla N ambiguità
codice.
--molteplicità=N
Conservare solo le letture delle molecole che sono state sequenziate almeno N volte. Le letture sono
considerati provenienti dalla stessa molecola originale se le loro coordinate allineate sono
identici.
--sottocampione=F
Sottocampionare una frazione F dei risultati. Ogni lettura è indipendente e casuale
scelto di essere mantenuto o meno.
--inside-regions=FILE
Leggi un elenco delle regioni da RISORSE, quindi mantieni solo gli allineamenti che si sovrappongono a un
regione annotata.
--outside-regions=FILE
Leggi un elenco delle regioni da RISORSE, quindi mantieni solo gli allineamenti che non si sovrappongono
regione annotata.
Special Filtri
-d, --rmdup=Q
Rimuovere i duplicati PCR, bloccare i punteggi di qualità a Q. Si considerano due letture
duplicati, se le loro coordinate allineate sono identiche. Se un genoma è impostato, il
viene utilizzato il miglior allineamento a quel genoma, altrimenti il miglior allineamento a livello globale. Entrambi
gli allineamenti devono essere buoni, come determinato da pendenzaeintercettarePer un set di
duplicati, viene chiamato un consenso, generalmente aumentando i punteggi di qualità. Se un
il punteggio di qualità risultante supera Q, è impostato su QQuesto filtro richiede l'input
da ordinare in base alle coordinate di allineamento selezionate genoma.
--duct-tape=NOME Sovrapporre gli allineamenti con nastro adesivo in contig e chiamare un consenso
per loro. Se un genoma è impostato, vengono utilizzati gli allineamenti a quel genoma, altrimenti il
allineamenti migliori a livello globale. Questo filtro richiede che l'input venga ordinato per allineamento
coordinata sul genoma. L'output è un insieme di contig, a ogni posizione viene assegnata
una base di consenso, un punteggio di qualità e probabilità per ogni possibile diallele. (It
si chiama nastratura perché assomiglia un po' a un assemblaggio, ma non lo è affatto
come solido.)
--edit-header=ED
Richiama l'editor ED sulla rappresentazione testuale dell'intestazione del flusso. Questo può essere
utilizzato per ripulire l'intestazione in cui si sono accumulati troppi elementi indesiderati.
Fusione Filtri
Dovrebbe essere specificato esattamente un filtro di unione sulla riga di comando, tutte le opzioni del filtro
che si verificano prima di quello fanno parte delle catene di filtri di input, tutti gli ulteriori filtri diventano
catene di output. Se non viene fornito alcun filtro di fusione, --concat si presume e tutti i filtri sono
filtri di input.
-c, --concat
Concatena tutti i flussi di input nell'ordine in cui appaiono sulla riga di comando.
-m, --unisci
Unisci flussi di input ordinati, producendo un risultato ordinato. Tutti gli input devono essere ordinati
nello stesso modo.
-j, --join
Unisci i flussi di input e conserva i singoli migliori risultati per ciascun genoma. Ogni input
il flusso deve contenere un record per ogni lettura, le letture vengono memorizzate in buffer nella memoria finché non vengono completate
dei loro successi vengono raccolti. In questo modo, l'unione funziona bene se tutti gli input sono quasi
nello stesso ordine. Se mancano delle letture da alcuni flussi, unirle sprecherà
memoria.
--mega-unione
Unisci molti flussi come quelli prodotti dall'esecuzione anfo-sge. Flussi che
operati sulle stesse letture vengono uniti, quindi tutto viene unito.
Uscita Opzioni
Se viene specificata un'opzione di output sulla riga di comando, la catena di filtri di output corrente viene terminata
e ne viene avviato uno nuovo. Se non viene specificata alcuna opzione di output, viene visualizzata una rappresentazione testuale dell'
il flusso finale è scritto in stdout. Tutte le opzioni di output accettano - per scrivere su stdout.
-o, --output FILE
Scrivi un flusso binario nativo (un messaggio protobuf compresso) in RISORSEScrivere un
il flusso binario e la sua rilettura avvengono senza perdita di dati.
--output-text FILE
Scrivi il flusso di testo protobuf su RISORSESe i genomi necessari sono disponibili, un
è inclusa la rappresentazione testuale degli allineamenti. Se il contesto il parametro è
set, che molte basi aggiuntive del riferimento a monte e a valle del
l'allineamento è incluso.
--output-sam=FILE
Scrivere gli allineamenti in formato SAM per RISORSE.
--output-glz FILE
Scrivi contig nel formato GLZ 0.9 per RISORSELa generazione di GLZ funziona solo dopo
applicazione di --nastro adesivo, ogni contig diventa un record GLZ.
--output-3aln FILE
Scrivere contig in un formato basato su tabella per RISORSEIl formato è ancora soggetto a
modifica, vedere il codice sorgente per la documentazione dettagliata.
--output-fasta FILE
Scrivi gli allineamenti(!) in formato FastA per RISORSEGli allineamenti sono scritti come coppie di
sequenza di riferimento e query, le coordinate allineate sono indicate nella descrizione
della sequenza di query. Se il contesto il parametro è impostato, che molte basi aggiuntive
del riferimento a monte e a valle dell'allineamento sono inclusi. Questo
il formato non è consigliato per un uso serio, esiste per supportare i formati legacy
applicazioni.
--output-fastq FILE
Scrivi sequenze(!) in formato FastQ per RISORSEScrivere FastQ in modo efficace
ricostituisce l'input a ANFO se non è stato effettuato alcun filtraggio sui risultati.
--output-table FILE
Scrivi statistiche per allineamento su RISORSEIl file ha tre colonne: sequenza
lunghezza, punteggio di allineamento, differenza rispetto al miglior allineamento successivo. È principalmente utile per
analizzare/visualizzare la distribuzione dei punteggi di allineamento.
--stats FILE
Scrivi statistiche semplici per RISORSE. Ciò si traduce in alcune semplici statistiche riassuntive di
un intero flusso: numero di sequenze allineate, lunghezza media, contenuto GC.
AMBIENTE
ANFO_PATH
Elenco separato da due punti delle directory in cui sono stati ricercati i file del genoma e dell'indice.
ANFO_TEMP
Spazio temporaneo utilizzato per l'ordinamento di file di grandi dimensioni.
Utilizzare anfo-tool online utilizzando i servizi onworks.net