Este é o comando gt-extractseq que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
gt-extractseq - Extrai sequências de determinado (s) arquivo (s) de sequência ou fastaindex.
SINOPSE
gt extrair seq [opção ...] [arquivo (s) de sequência] | fastaindex
DESCRIÇÃO
-de compos [valor]
extrair sequência desta posição contando de 1 em (padrão: 0)
-topos [valor]
extrair a sequência até esta posição contando de 1 em (padrão: 0)
-Combine [corda]
extraia todas as sequências cuja descrição corresponda ao padrão fornecido. O padrão dado
deve ser uma expressão regular estendida válida. (padrão: indefinido)
-chaves [nome do arquivo]
extrair substrings para chaves no arquivo especificado (padrão: indefinido)
-largura [valor]
definir largura de saída para impressão de sequência FASTA (0 desativa a formatação) (padrão: 0)
-o [nome do arquivo]
redirecionar a saída para o arquivo especificado (padrão: indefinido)
-gzip [sim | não]
escrever arquivo de saída compactado gzip (padrão: não)
-bzip2 [sim | não]
escrever arquivo de saída compactado bzip2 (padrão: não)
-força [sim | não]
forçar a gravação no arquivo de saída (padrão: não)
-Socorro
exibir ajuda e sair
-versão
exibir informações de versão e sair
A opção -keys permite extrair substrings ou sequências da sequência dada
arquivo ou de um índice fasta. As substrings a serem extraídas são especificadas em um arquivo de chave
dado como argumento para esta opção. O arquivo da chave deve conter linhas do formulário
k
or
kij
onde k é uma string (a chave) e os opcionais i e j são inteiros positivos, de modo que
i⇐j. k é a chave e os números opcionais i e j especificam a primeira posição do
substring e a última posição da substring a ser extraída. As posições são
contado de 1. Se k for idêntico à corda entre o primeiro e o segundo
ocorrência do símbolo | em um cabeçalho fasta, então o cabeçalho fasta e o correspondente
seqüência é produzida. Por exemplo, no cabeçalho fasta
> tr | A0AQI4 | A0AQI4_9ARCH Putativa monooxigenase de amônia (fragmento)
a chave fasta é A0AQI4. Se i e j forem especificados, a substring correspondente
é mostrado no formato fasta. No último caso, o cabeçalho da sequência formatada fasta em
a saída começa com
> kij
seguido pelo cabeçalho fasta original original.
Se a entrada da sequência forem arquivos fasta, o seguinte será válido:
· Linhas duplicadas no arquivo de entrada levam a apenas uma sequência na saída
· As sequências são produzidas de acordo com a ordem nos arquivos de sequência originais
· A formatação da saída pode ser controlada pelas opções -largura, -o, -gzip e
-bzip2
Se a entrada da sequência vier de um índice fasta (veja abaixo), o seguinte é válido:
· Opção -largura É necessário
· Opção -o, -gzip e -bzip2 não funciona
· As sequências são produzidas na ordem em que as chaves correspondentes aparecem no arquivo da chave
Se o final da lista de argumentos contém apenas um nome de arquivo, digamos fastaindex, então ele é
verificado se existe um arquivo fastaindex.kys. Isso faz parte do índice fasta, que é
construído chamando a ferramenta de sufixação da seguinte forma:
sufixador gt -protein -ssp -tis -des -sds -kys -indexname fastaindex \
-db arquivodeentrada1 [arquivodeentrada2 ..]
Isso lê os arquivos de sequência de proteínas fornecidos para a opção -db e cria vários arquivos:
· Um arquivo fastaindex.esq representando a seqüência.
· Um arquivo fastaindex.ssp especificando as posições do separador de sequência.
· Um arquivo fastaindex.des mostrando os cabeçalhos fasta linha por linha.
· Um arquivo fastaindex.sds fornecendo as posições do delimitador do cabeçalho da sequência.
· Um arquivo fastaindex.kys contendo as chaves nos arquivos fasta.
Para que o comando sufixador funcione, as chaves do formato | chave | no cabeçalho fasta deve
satisfazer as seguintes restrições:
· Todos eles devem ter o mesmo comprimento, não mais do que 128 e não mais do que 1
· Eles têm que aparecer em ordem lexicográfica
RELATÓRIOS INSETOS
Reportar bugs para[email protegido]>.
Use gt-extractseq online usando serviços onworks.net