2e score

Run 2ndscore in OnWorks gratis hostingprovider via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht 2ndscore die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Uitvoeren in Ubuntu Uitvoeren in Fedora Uitvoeren in Windows Sim Uitvoeren in MACOS Sim

PROGRAMMA:

NAAM

2e score - vind de beste haarspeld die op elke positie is verankerd.

KORTE INHOUD

2e score in.fasta > uit.haarspelden

PRODUCTBESCHRIJVING

Voor elke positie in de reeks levert dit een regel op:

-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(partituur) (begin .. einde) (links context) (haarspeld) (rechts context)

Voor posities nabij de uiteinden van de reeksen kan de context worden opgevuld met 'x'
karakters. Als er geen haarspeld kan worden gevonden, is de score 'Geen'.

Er kunnen meerdere fasta-bestanden worden gegeven en in elk fasta-bestand kunnen meerdere reeksen voorkomen. De
uitvoer voor elke reeks wordt gescheiden door een regel die begint met '>' en die de . bevat
FASTA beschrijving van de sequentie.

Omdat de haarspeldscores van de plus-streng en min-streng kunnen verschillen (vanwege GU
binding in RNA), standaard voert 2ndscore twee sets haarspelden uit voor elke reeks: de
FORWARD-haarspelden en de REVERSE-haarspelden. Alle voorwaartse haarspelden worden als eerste uitgevoerd, en
worden geïdentificeerd door het woord 'FORWARD' aan het einde van de regel '>' die eraan voorafgaat.
Evenzo worden de REVERSE-haarspelden weergegeven na een '>'-regel die eindigt op 'REVERSE'. als jij
als u alleen de ene of de andere streng wilt zoeken, kunt u het volgende gebruiken:

--no-fwd Druk de FORWARD haarspelden niet af
--no-rvs Druk de REVERSE haarspelden niet af

Je kunt de gebruikte energiefunctie instellen, net als bij transterm met de --gc, --au, --gu,
--mm, --gap opties. De opties --min-loop, --max-loop en --max-len worden ook ondersteund.

FORMAT OF HET .TAS FILES
De kolommen voor de .bag-bestanden zijn, in volgorde:

1. gen_naam
2. terminator_start
3. terminator_einde
4. haarspeldscore
5. staart_score
6. terminator_reeks

7. terminator_trust: een combinatie van de haarspeld- en staartscore die
houdt rekening met de waarschijnlijkheid van dergelijke scores in een willekeurige volgorde. Dit
is de belangrijkste "score" voor de terminator en wordt berekend zoals beschreven in
de krant.

8. APPROXIMATE_distance_from_end_of_gene: Het *geschatte* aantal basen
paren tussen het einde van het gen en het begin van de terminator. Dit
is op verschillende manieren bij benadering: Ten eerste, (en belangrijkste) TransTermHP
gebruikt niet altijd de echte genuiteinden. Afhankelijk van de opties die je geeft
het kan wat van de uiteinden van genen afsnijden om terminators aan te pakken die
gedeeltelijk overlappen met genen. Ten tweede, waar de terminator "begint"
is niet zo goed gedefinieerd. Dit veld is alleen bedoeld voor een sanity check
(terminators die naar verluidt de beste zijn in de buurt van de uiteinden van genen, zouden dat niet moeten zijn
_te ver_ van het einde van het gen).

GEBRUIK MAKEND VAN TRANSSTERM ZONDER GENOM ANOTATIES
TransTermHP gebruikt bekende geninformatie voor slechts 3 dingen: (1) taggen van de vermeende
terminators als "inside genen" of "intergenic", (2) kiezen van de achtergrond GC-
inhoudspercentage om de scores te berekenen, omdat genen vaak verschillende GC-inhoud hebben
dan de intergene regio's, en (3) het produceren van iets beter leesbare output. Artikelen (1)
en (3) zijn niet echt nodig, en (2) heeft geen effect als je genen ongeveer hetzelfde hebben
GC-inhoud als uw intergene regio's.

Helaas heeft TransTermHP nog geen eenvoudige optie om zonder annotatie te werken
bestand (ofwel .ptt of .coords), en er moeten minimaal 2 genen aanwezig zijn. De oplossing
is om valse, kleine genen te creëren die elk chromosoom flankeren. Maak hiervoor een nep.coords
bestand dat alleen deze twee regels bevat:

fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id

waarbij L de lengte is van de invoerreeks en L-1 1 minder is dan de lengte van de invoer
volgorde. "chrom_id" moet het woord zijn dat direct volgt op ">" in het .fasta-bestand
die uw reeks bevatten. (Als uw .fasta-bestand bijvoorbeeld begon met ">seq1", dan
chrom_id = seq1).

Dit creëert een "nep"-annotatie met twee 1-base-lange genen die de sequentie flankeren in a
staart-aan-staart arrangement: --> <--. TransTermHP kan dan worden uitgevoerd met:

transterm -p expterm.dat sequence.fasta nep.coords

Als het G/C-gehalte van uw intergene regio's ongeveer hetzelfde is als uw genen, dan is dit:
zal niet al te veel effect hebben op de scores die terminators ontvangen. Anderzijds,
dit gebruik van TransTermHP is niet veel getest, dus het is moeilijk om in te staan voor zijn
nauwkeurigheid.

Gebruik 2ndscore online met onworks.net-services