Este é o comando alistat que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
alistat - mostra estatísticas para um arquivo de alinhamento múltiplo
SINOPSE
Alistat [opções] arquivo de alinhamento
DESCRIÇÃO
Alistat lê um alinhamento de sequência múltipla do arquivo arquivo de alinhamento em qualquer suporte
formato (incluindo SELEX, GCG MSF e CLUSTAL) e mostra uma série de estatísticas simples
sobre isso. Essas estatísticas incluem o nome do formato, o número de sequências, o
número total de resíduos, a média e intervalo dos comprimentos de sequência, o alinhamento
comprimento (por exemplo, incluindo caracteres de lacuna).
Também são mostradas algumas identidades percentuais. Um percentual de identidade de alinhamento em pares é definido
as (identidades / MIN (len1, lente2)) onde idents é o número de identidades exatas e len1,
Len2 são os comprimentos desalinhados das duas sequências. A "identidade percentual média", "mais
par relacionado "e" par mais não relacionado "do alinhamento são a média, o máximo e
mínimo de todos os pares (N) (N-1) / 2, respectivamente. O "seq mais distante" é calculado por
encontrar a identidade de pares máxima (melhor relativo) para todas as N sequências e, em seguida, encontrar
o mínimo desses N números (portanto, a sequência mais remota).
OPÇÕES
-a Mostrar informações detalhadas adicionais: uma tabela com uma linha por sequência mostrando
nome, comprimento e sua identidade de pares mais alta e mais baixa. Essas linhas são
prefixado com um caractere * para ativar facilmente grep 'separá-los e classificá-los.
Por exemplo, Alistat -a foo.slx | grep * | tipo -n +3 dá uma lista de classificação do
sequências mais distantes no alinhamento. Incompatível com o -f opção.
-f Rápido; use um método de amostragem para estimar a% id média. Quando esta opção é
escolhido, Alistat não mostra os outros três números de identidade de pares. Esse
opção é útil para alinhamentos muito grandes, para os quais o cálculo completo (N) (N-1)
de todos os pares seria proibitivo (por exemplo, o alinhamento GP120 da Pfam, com mais de 10,000
sequências). Incompatível com o -a opção.
-h Imprima uma breve ajuda; inclui o número da versão e um resumo de todas as opções, incluindo
opções de especialistas.
-q fique quieto - suprima o cabeçalho detalhado (nome do programa, número e data de lançamento, o
parâmetros e opções em vigor).
-B (Babelfish). Autodetectar e ler um formato de arquivo de sequência diferente do padrão
(FASTA). Quase qualquer formato de arquivo de sequência comum é reconhecido (incluindo Genbank,
EMBL, SWISS-PROT, PIR e formatos de sequência não alinhada GCG, e Estocolmo, GCG MSF,
e formatos de alinhamento Clustal). Veja a documentação impressa para uma lista completa
de formatos suportados.
EXPERT OPÇÕES
--informar
Especifique se o arquivo de sequência está em formato , em vez do FASTA padrão
formato. Exemplos comuns incluem Genbank, EMBL, GCG, PIR, Stockholm, Clustal, MSF,
ou PHYLIP; consulte a documentação impressa para uma lista completa dos formatos aceitos
nomes. Esta opção substitui o formato padrão (FASTA) e o -B babelfish
opção de autodetecção.
Use alistat online usando serviços onworks.net