EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

scorul 2

Rulați 2ndscore în furnizorul de găzduire gratuit OnWorks peste Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda 2ndscore care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


2ndscore - găsiți cel mai bun ac de păr ancorat la fiecare poziție.

REZUMAT


2ndscore in.fasta > out.hairpins

DESCRIERE


Pentru fiecare poziție din secvență, aceasta va scoate o linie:

-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(scor) (început .. sfârșit) (context din stânga) (ac de păr) (conținut din dreapta)

Pentru pozițiile în apropierea sfârșitului secvenței, contextul poate fi umplut cu „x”
personaje. Dacă nu poate fi găsit niciun ac de păr, scorul va fi „Niciunul”.

Pot fi date mai multe fișiere fasta și mai multe secvențe pot fi în fiecare fișier fasta. The
ieșirea pentru fiecare secvență va fi separată printr-o linie care începe cu „>” și ​​care conține
Descrierea FASTA a secvenței.

Deoarece scorurile acelor de păr ale șuviței plus și minus pot diferi (datorită GU
legarea în ARN), implicit 2ndscore scoate două seturi de agrafe pentru fiecare secvență:
Acele de păr FORWARD și cele REVERSE. Toate agrafele de păr înainte sunt scoase mai întâi și
sunt identificate prin faptul că au cuvântul „FOWARD” la sfârșitul liniei „>” care le precede.
În mod similar, agrafele de păr REVERSE sunt listate după o linie „>” care se termină cu „REVERSE”. daca tu
doriți să căutați doar una sau alta componentă, puteți utiliza:

--no-fwd Nu tipăriți agrafele FORWARD
--no-rvs Nu tipăriți agrafele REVERSE

Puteți seta funcția de energie utilizată, la fel ca în cazul transterm cu --gc, --au, --gu,
--mm, --gap opțiuni. Opțiunile --min-loop, --max-loop și --max-len sunt de asemenea acceptate.

FORMAT OF THE .SAC DOSARE
Coloanele pentru fișierele .bag sunt, în ordine:

1. nume_genă
2. terminator_start
3. terminator_end
4. scor_ac de păr
5. scor_coada
6. terminator_secvență

7. terminator_confidence: o combinație dintre ac de păr și coada scor care
ia în considerare cât de probabil sunt astfel de scoruri într-o secvență aleatorie. Acest
este „scorul” principal pentru terminator și este calculat așa cum este descris în
hârtia.

8. APPROXIMATE_distance_from_end_of_gene: numărul *aproximativ* de bază
perechi între sfârșitul genei și începutul terminatorului. Acest
este aproximativă în mai multe moduri: În primul rând, (și cel mai important) TransTermHP
nu folosește întotdeauna capetele genelor reale. În funcție de opțiunile pe care le oferiți
poate tăia unele capete ale genelor pentru a se ocupa de terminatorii care
se suprapun parțial cu genele. În al doilea rând, unde terminatorul „începe”
nu este atat de bine definit. Acest câmp este destinat doar unei verificări de sănătate
(Terminatorii raportați a fi cei mai buni lângă capetele genelor nu ar trebui să fie
_prea departe_ de capătul genei).

UTILIZAREA TRANSTERM FĂRĂ GENOMUL ANOTAȚII
TransTermHP folosește informații despre gene cunoscute doar pentru 3 lucruri: (1) etichetarea presupusului
terminatori ca „gene din interior” sau „intergenici”, (2) alegând fundalul GC-
procentaj de conținut pentru a calcula scorurile, deoarece genele au adesea conținut GC diferit
decât regiunile intergenice și (3) producând rezultate puțin mai lizibile. Articole (1)
și (3) nu sunt cu adevărat necesare și (2) nu are niciun efect dacă genele tale au aproximativ același lucru
Conținutul GC ca regiunile tale intergenice.

Din păcate, TransTermHP nu are încă o opțiune simplă de rulare fără adnotare
fișier (fie .ptt sau .coords) și necesită cel puțin 2 gene pentru a fi prezente. Soluția
este de a crea gene false, mici, care flanchează fiecare cromozom. Pentru a face acest lucru, faceți un fake.coords
fișier care conține doar aceste două rânduri:

fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id

unde L este lungimea secvenței de intrare și L-1 este cu 1 mai mică decât lungimea intrării
secvenţă. „chrom_id” ar trebui să fie cuvântul care urmează direct „>” din fișierul .fasta
care conține secvența dvs. (Dacă, de exemplu, fișierul .fasta începe cu „>seq1”, atunci
chrom_id = seq1).

Aceasta creează o adnotare „falsă” cu două gene lungi de 1 bază care flanchează secvența într-un
aranjament coadă la coadă: --> <--. TransTermHP poate fi apoi rulat cu:

transterm -p expterm.dat sequence.fasta fake.coords

Dacă conținutul G/C al regiunilor tale intergenice este aproximativ același cu genele tale, atunci asta
nu va avea un efect prea mare asupra punctajelor pe care terminatorii le primesc. Pe de altă parte,
această utilizare a TransTermHP nu a fost deloc testată, așa că este greu să garantezi pentru
precizie.

Utilizați 2ndscore online folosind serviciile onworks.net


Ad