Dit is het commando gmod_gff3_preprocessor.plp dat kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator
PROGRAMMA:
NAAM
$ 0 - Bereidt een GFF3-bestand voor voor bulkladen in een chado-database.
KORTE INHOUD
% gmod_gff_preprocessor [opties] --gfffile
OPDRACHTREGEL OPTIES
--gfffile Het bestand dat GFF3 bevat (optioneel, kan read
van standaard)
--outfile De naam van de kernel die zal worden gebruikt voor het benoemen van resultaatbestanden
--splitfile Splits de bestanden op in meer beheersbare brokken, waarbij
een argument om het splitsen te regelen
--onlysplit Splits de bestanden en stop dan (dwz niet sorteren)
--nosplit De bestanden niet splitsen (dwz alleen sorteren)
--hasrefseq Stel dit in als het bestand een referentiereeks bevat
(Alleen nodig als er geen bestanden worden gesplitst)
--dbprofile Specificeer een gmod.conf profielnaam (gebruik anders de standaard)
--inheritance_tiers Hoeveel overervingsniveaus verwacht u in dit bestand
hebben (standaard: 3)
PRODUCTBESCHRIJVING
splitfile -- Als u deze vlag gewoon op 1 zet, wordt het bestand gesplitst op basis van referentie
reeks. Als u een optioneel argument opgeeft, wordt het verder opgesplitst volgens
deze regels:
source=1 Splitst bestanden volgens de waarde in de bronkolom
source=a,b,c Plaatst regels met bronnen die overeenkomen (via reguliere expressie)
'a', 'b' of 'c' in een apart bestand
type=a,b,c Plaatst regels met typen die overeenkomen met 'a', 'b' of 'c' in een
apart bestand
Als u bijvoorbeeld wilt dat al uw analyseresultaten in een apart bestand terechtkomen, kunt u
kan duiden op '--splitfile type=match', en alle cDNA_match, EST_match en
cross_genome_match-functies zouden in afzonderlijke bestanden worden geplaatst (gescheiden door referentievolgorde).
inheritence_tiers -- Het aantal overervingsniveaus van dit bestand. Als bijvoorbeeld
het bestand bevat "centrale dogma"-genen (gen/mRNA/exon,polypeptide), dan heeft het 3. Omhoog
tot 4 wordt ondersteund, maar hoe hoger het nummer, hoe langzamer het presteert. Als je dat niet doet
Weet je, 3 is een redelijke schatting.
FAST volgorde
Als het GFF3-bestand aan het einde een FASTA-reeks bevat, wordt de reeks in een
apart bestand met de extensie '.fasta'. Dit fasta-bestand kan daarna apart worden geladen
de gesplitste en/of gesorteerde GFF3-bestanden worden geladen met het commando:
gmod_bulk_load_gff3.pl -g
Gebruik gmod_gff3_preprocessor.plp online met behulp van onworks.net-services