Dit is de opdracht formatdb die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator
PROGRAMMA:
NAAM
formatdb - formatteer eiwit- of nucleotidedatabases voor BLAST
KORTE INHOUD
formaatdb [-] [-B bestandsnaam] [-F bestandsnaam] [-L bestandsnaam] [-T bestandsnaam] [-V] [-a] [-b] [-e]
[-i bestandsnaam] [-l bestandsnaam] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
PRODUCTBESCHRIJVING
formaatdb moet worden gebruikt om databases met eiwit- of nucleotidebronnen eerder te formatteren
deze databases kunnen worden doorzocht met blastall, blastpgp of MegaBLAST. De brondatabase
kan in FASTA- of ASN.1-indeling zijn. Hoewel het FASTA-formaat het meest wordt gebruikt als
invoer voor formaatdb, is het gebruik van ASN.1 voordelig voor degenen die ASN.1 gebruiken als de
gemeenschappelijke bron voor andere formaten zoals het GenBank-rapport. Eenmaal een brondatabasebestand
is geformatteerd door formaatdb het is niet nodig door BLAST. Houd er rekening mee dat als u dat bent
gaat periodieke updates toepassen op uw BLAST-databases met behulp van samenvoegen(1), moet u
bewaar het brondatabasebestand.
OPTIES
Hieronder vindt u een overzicht van de mogelijkheden.
- Gebruiksbericht afdrukken
-B bestandsnaam
Binaire Gifile gemaakt van de Gifile gespecificeerd door -F. Deze optie specificeert de
naam van een binair GI-lijstbestand. Deze optie moet worden gebruikt met de -F optie. EEN
tekst GI-lijst kan worden gespecificeerd met de -F optie en de -B optie zal opleveren
die GI-lijst in binair formaat. Het binaire bestand is kleiner en BLAST heeft dit niet nodig
om het te converteren, zodat het sneller kan worden gelezen.
-F bestandsnaam
Gifile (bestand met lijst van gi's) voor gebruik met -B or -L
-L bestandsnaam
Maak een aliasbestand met de naam bestandsnaam, waardoor de doorzochte reeksen tot die reeksen worden beperkt
gespecificeerd door -F.
-T bestandsnaam
Stel de taxonomie-ID's in ASN.1-deflines in volgens de tabel in bestandsnaam.
-V Verbose: controleer op niet-unieke tekenreeks-ID's in de database
-a Invoerbestand is database in ASN.1-indeling (anders wordt FASTA verwacht)
-b ASN.1-database is binair (in tegenstelling tot ASCII-tekst)
-e Invoer is een Seq-invoer. Een ASN.1-brondatabase (ascii-tekst of binair) kan dat wel
bevatten een Bioseq-set of slechts één Bioseq. In het laatste geval -e moet worden verstrekt.
-i bestandsnaam
Voer bestand(en) in voor opmaak
-l bestandsnaam
Naam logbestand (standaard = formatdb.log)
-n str Basisnaam voor BLAST-bestanden (standaard de naam van het originele FASTA-bestand)
-o SeqID parseren en indexen maken. Als de brondatabase in FASTA-indeling is, wordt het
database-ID's in de FASTA-definitieregel moeten de conventies van volgen
het FASTA Defline-formaat.
-p F Input is een nucleotide, geen eiwit.
-s Indexeer alleen op toetreding, niet op locus. Dit is vooral handig voor reekssets
zoals de EST's waar de toetredings- en locusnamen identiek zijn. Formatdb wordt uitgevoerd
sneller en produceert kleinere tijdelijke bestanden als deze optie wordt gebruikt. Het is sterk
aanbevolen voor EST's, STS's, GSS's en HTGS's.
-t str Titel voor databasebestand [String]
-v N Splits grote FASTA-bestanden op in `volumes' van grootte N miljoen brieven (4000 door
standaard). Als onderdeel van het maken van een volume, formaatdb schrijft een nieuw type BLAST
databasebestand, een aliasbestand genoemd, met de extensie `nal' of `pal'.
Gebruik formatdb online met behulp van onworks.net-services