IngleseFranceseSpagnolo

Ad


Favicon di OnWorks

2° punteggio

Esegui 2ndscore nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questo è il comando 2ndscore che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


2° punteggio: trova il miglior tornante ancorato in ogni posizione.

SINOSSI


2°punteggio in.fasta > out.hairpins

DESCRIZIONE


Per ogni posizione nella sequenza questo produrrà una riga:

-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(punteggio) (inizio .. fine) (contesto sinistro) (tornante) (contesto destro)

Per le posizioni vicine alle estremità delle sequenze, il contesto può essere riempito con 'x'
caratteri. Se non viene trovato alcun tornante, il punteggio sarà "Nessuno".

Possono essere dati più file Fasta e più sequenze possono essere in ogni file Fasta. Il
l'output per ogni sequenza sarà separato da una riga che inizia con '>' e contiene il
FASTA descrizione della sequenza.

Poiché i punteggi della forcina del filo più e meno possono differire (a causa di GU
legame nell'RNA), per impostazione predefinita 2ndscore emette due serie di forcine per ogni sequenza: il
Le forcine FORWARD e le forcine REVERSE. Tutti i tornanti in avanti vengono emessi per primi e
sono identificati dalla parola 'FORWARD' alla fine della riga '>' che li precede.
Allo stesso modo, i tornanti REVERSE sono elencati dopo una riga '>' che termina con 'REVERSE'. Se tu
vuoi cercare solo l'uno o l'altro filone, puoi usare:

--no-fwd Non stampare le forcine FORWARD
--no-rvs Non stampare le forcine REVERSE

Puoi impostare la funzione di energia utilizzata, proprio come con transterm con --gc, --au, --gu,
--mm, --gap opzioni. Sono supportate anche le opzioni --min-loop, --max-loop e --max-len.

FORMATO OF LA .BORSA FILE
Le colonne per i file .bag sono, nell'ordine:

1. nome_gene
2. terminatore_inizio
3. terminatore_end
4. tornante_score
5. tail_score
6. terminatore_sequenza

7. terminator_confidence: una combinazione di tornante e punteggio di coda che
tiene conto della probabilità di tali punteggi in una sequenza casuale. Questo
è il "punteggio" principale per il terminatore e viene calcolato come descritto in
la carta.

8. APPROXIMATE_distance_from_end_of_gene: il numero *approssimativo* di base
coppie tra la fine del gene e l'inizio del terminatore. Questo
è approssimativo in diversi modi: Primo, (e più importante) TransTermHP
non usa sempre il vero gene finisce. A seconda delle opzioni che dai
può tagliare alcune estremità dei geni per gestire i terminatori che
si sovrappongono parzialmente ai geni. Secondo, dove "inizia" il terminatore
non è così ben definito Questo campo è destinato esclusivamente a un controllo di integrità
(i terminatori segnalati come i migliori vicino alla fine dei geni non dovrebbero esserlo
_troppo lontano_ dalla fine del gene).

UTILIZZO TRASFERIMENTO SENZA GENOMA ANNOTAZIONI
TransTermHP utilizza informazioni genetiche note solo per 3 cose: (1) etichettare il putativo
terminatori come "geni interni" o "intergenici", (2) scegliendo lo sfondo GC-
percentuale di contenuto per calcolare i punteggi, perché i geni spesso hanno un contenuto GC diverso
rispetto alle regioni intergeniche e (3) producendo un output leggermente più leggibile. Articoli (1)
e (3) non sono realmente necessari, e (2) non ha alcun effetto se i tuoi geni hanno più o meno lo stesso
Contenuti GC come regioni intergeniche.

Sfortunatamente, TransTermHP non ha ancora un'opzione semplice per l'esecuzione senza un'annotazione
file (.ptt o .coords) e richiede la presenza di almeno 2 geni. La soluzione
è creare geni falsi e piccoli che fiancheggiano ciascun cromosoma. Per fare questo, crea un fake.coords
file che contiene solo queste due righe:

fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id

dove L è la lunghezza della sequenza di input e L-1 è 1 inferiore alla lunghezza dell'input
sequenza. "chrom_id" dovrebbe essere la parola che segue direttamente ">" nel file .fasta
contenente la tua sequenza (Se, ad esempio, il tuo file .fasta inizia con ">seq1", allora
id_cromo = seq1).

Questo crea un'annotazione "falsa" con due geni lunghi 1 base che fiancheggiano la sequenza in a
disposizione coda a coda: --> <--. TransTermHP può quindi essere eseguito con:

transterm -p expterm.dat sequenza.fasta fake.coords

Se il contenuto di G/C delle tue regioni intergeniche è più o meno lo stesso dei tuoi geni, allora questo
non avrà un grande effetto sui punteggi ricevuti dai terminatori. D'altra parte,
questo uso di TransTermHP non è stato testato molto, quindi è difficile garantirlo
precisione.

Usa 2ndscore online utilizzando i servizi onworks.net


Ad