Questo è il comando sfetch che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
sfetch - ottiene una sequenza da un database flatfile.
SINOSSI
tratto [opzioni] nomesequenza
DESCRIZIONE
tratto recupera la sequenza denominata nomesequenza da un database di sequenze.
Il database utilizzato è controllato dal -d e -D opzioni, o "piccoli database" e
"grandi banche dati". La posizione della directory dei "grandi database" può essere specificata da
variabili d'ambiente, come $SWDIR per Swissprot e $GBDIR per Genbank (vedi -D da
elenco completo). Per i "piccoli database" è necessario specificare un percorso file completo. Di
predefinito, se nessuna opzione è specificata e il nome sembra un identificatore Swissprot
(ad esempio ha un carattere _), la variabile d'ambiente $SWDIR viene utilizzata per tentare di
recuperare la sequenza nomesequenza di Swissprot.
Sono disponibili una varietà di altre opzioni che consentono il recupero di sottosequenze (-f, -t);
recupero per numero di accesso invece che per nome (-a); riformattare la sequenza estratta
in una varietà di altri formati (-F); eccetera.
Se il database è stato indicizzato SSI, il recupero della sequenza sarà estremamente efficiente;
altrimenti, il recupero potrebbe essere dolorosamente lento (l'intero database potrebbe dover essere letto in memoria
per trovare nomesequenza). L'indicizzazione SSI è consigliata per tutti i database di grandi dimensioni o permanenti. Il
Programma sinindex crea indici SSI per qualsiasi file di sequenza.
tratto è stato originariamente chiamato getseq, ed è stato rinominato perché si scontrava con un programma GCG
con lo stesso nome
VERSIONI
-a Interpretare nomesequenza come numero di accesso, non come identificatore.
-d
Recupera la sequenza da un file di sequenza denominato . Se un indice GSI
.gsi esiste, viene utilizzato per velocizzare il recupero.
-f
Estrai una sottosequenza partendo dalla posizione , piuttosto che da 1. Vedi -T.
If è maggiore (come specificato dal -t opzione), quindi la sequenza
viene estratto come suo complemento inverso (si presume sia la sequenza di acido nucleico).
-h Stampa breve guida; include il numero di versione e il riepilogo di tutte le opzioni, incluso
opzioni per esperti.
-o
Indirizza l'output a un file denominato . Per impostazione predefinita, l'output andrebbe a
normale.
-r
Rinomina la sequenza nell'output dopo l'estrazione. Per impostazione predefinita, il
l'identificatore di sequenza originale verrebbe mantenuto. Utile, ad esempio, in caso di recupero
un frammento di sequenza; le coordinate del frammento potrebbero essere aggiunte al nome
(questo è ciò che fa Pfam).
-t
Estrai una sottosequenza che termina in posizione , piuttosto che alla fine del
sequenza. Vedere -F. If è meno di (come specificato dal -f opzione),
quindi la sequenza viene estratta come complemento inverso (si assume che sia
sequenza di acidi nucleici)
-D
Recupera la sequenza dal database della sequenza principale codificato . Da ogni
codice, ci is an Industria XNUMX variabile che specifica il percorso della directory a quello
Banca dati. I codici riconosciuti e le corrispondenti variabili d'ambiente sono -Dsw
(Protetto svizzero, $SWDIR); -Dpir (PIR, $PIRDIR); -Deme (EMBL, $EMBLDIR); -Dgb (Banca Genovese,
$GBDIR); -Dwp (Wormpep, $WORMDIR); e -Dowl (GUFO, $OWLDIR). Ogni database viene letto
nel suo formato flatfile nativo.
-F
Riformattare la sequenza estratta in un formato diverso. (Per impostazione predefinita, la sequenza
viene estratto dal database nello stesso formato del database.) Disponibile
i formati sono emblema, veloce, banca dati, gcc, camminatore, Zuker, io, piro, calamaro, e crudo.
EXPERT VERSIONI
--informati
Specificare che il file di sequenza è in formato , piuttosto che il FASTA . predefinito
formato. Esempi comuni includono Genbank, EMBL, GCG, PIR, Stoccolma, Clustal, MSF,
o FILIPPO; vedere la documentazione stampata per un elenco completo dei formati accettati
nomi. Questa opzione sovrascrive il formato predefinito (FASTA) e il -B pesce di babele
opzione di rilevamento automatico.
Usa sfetch online utilizzando i servizi onworks.net