Este é o comando alimask que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
alimask - Adicionar linha de máscara a um alinhamento de sequência múltipla
SINOPSE
Alimask [opções]
DESCRIÇÃO
Alimask é usado para aplicar uma linha de máscara a um alinhamento de sequência múltipla, com base no
alinhamento ou coordenadas do modelo. Quando hmm construir recebe um alinhamento mascarado como entrada,
produz um modelo de perfil no qual as probabilidades de emissão em posições mascaradas são definidas
para corresponder à frequência de fundo, em vez de ser definido com base nas frequências observadas em
o alinhamento. As taxas de inserção e exclusão específicas da posição não são alteradas, mesmo em
regiões mascaradas. Alimask detecta automaticamente o formato de entrada e produz alinhamentos mascarados em
Formato de Estocolmo. pode conter apenas um alinhamento de sequência.
Uma motivação comum para mascarar uma região em um alinhamento é que a região contém um
repetição em tandem simples que é observada como causa de uma taxa inaceitavelmente alta de falsos positivos
exitos.
No caso mais simples, um intervalo de máscara é dado em coordenadas relativas à entrada
alinhamento, usando --alirange . No entanto, é mais comum que a região seja
mascarado foi identificado em coordenadas relativas ao modelo de perfil (por exemplo, com base em
reconhecer um padrão de repetição simples em alinhamentos de acertos falsos ou no logotipo do HMM). De jeito nenhum
colunas de alinhamento são convertidas para coincidir com as posições de estado no perfil (consulte o --symfrac
bandeira para hmm construir para discussão), de modo que as posições do modelo não necessariamente correspondem a
posições da coluna de alinhamento. Para remover o fardo de converter posições de modelo para
posições de alinhamento, Alimask aceita a entrada do intervalo da máscara nas coordenadas do modelo também,
utilização --modelrange . Ao usar este sinalizador, Alimask determina qual alinhamento
posições seriam identificadas por hmm construir como estados de correspondência, um processo que requer que
todos os hmm construir sinalizadores que impactam essa decisão sejam fornecidos para Alimask. É por este motivo
que muitos dos hmm construir sinalizadores também são usados por Alimask.
OPÇÕES
-h Ajuda; imprimir um breve lembrete do uso da linha de comando e todas as opções disponíveis.
-o Direcione a saída do resumo para o arquivo , ao invés de stdout.
OPÇÕES PARA ESPECIFICANDO MASK GAMA
Um único intervalo de máscara é fornecido como um par separado por traços, como --modelrange 10-20 e
vários intervalos podem ser enviados como uma lista separada por vírgulas, --modelrange 10-20,30-42.
--modelrange
Fornece o (s) intervalo (s) fornecido (s) nas coordenadas do modelo.
--alirange
Fornece o (s) intervalo (s) fornecido (s) em coordenadas de alinhamento.
--apendmask
Adicione à máscara existente encontrada com o alinhamento. O padrão é sobrescrever qualquer
máscara existente.
--model2ali
Em vez de realmente produzir o alinhamento mascarado, basta imprimir o (s) intervalo (s) do modelo
correspondente à (s) faixa (s) de alinhamento de entrada.
--ali2model
Em vez de realmente produzir o alinhamento mascarado, basta imprimir os intervalos de alinhamento
correspondente à (s) faixa (s) do modelo de entrada.
OPÇÕES PARA ESPECIFICANDO A ALFABETO
O tipo de alfabeto (amino, DNA ou RNA) é autodetectado por padrão, observando o
composição do arquivo msa. A autodetecção normalmente é bastante confiável, mas ocasionalmente
o tipo de alfabeto pode ser ambíguo e a autodetecção pode falhar (por exemplo, em um brinquedo minúsculo
alinhamentos de apenas alguns resíduos). Para evitar isso, ou para aumentar a robustez em sistemas automatizados
pipelines de análise, você pode especificar o tipo de alfabeto de arquivo msa com essas opções.
--amino
Especifique que todas as sequências em arquivo msa são proteínas.
--dna Especifique que todas as sequências em arquivo msa são DNAs.
--rna Especifique que todas as sequências em arquivo msa são RNAs.
OPÇÕES CONTROLANDO PROFILE CONSTRUÇÃO
Essas opções controlam como as colunas de consenso são definidas em um alinhamento.
--velozes Defina as colunas de consenso como aquelas que têm uma fração> = Symfrac de resíduos como
opõe-se a lacunas. (Veja abaixo para o --symfrac opção.) Este é o padrão.
--mão Defina colunas de consenso no próximo perfil usando anotação de referência para o múltiplo
alinhamento. Isso permite que você defina quaisquer colunas de consenso que desejar.
--symfrac
Defina o limite de fração de resíduo necessário para definir uma coluna de consenso quando
usando o --velozes opção. O padrão é 0.5. A fração do símbolo em cada coluna é
calculado após levar em conta a ponderação de sequência relativa e ignorar a lacuna
caracteres correspondentes às extremidades dos fragmentos de sequência (em oposição a internos
inserções / exclusões). Definir como 0.0 significa que cada coluna de alinhamento irá
ser atribuído como consenso, o que pode ser útil em alguns casos. Configurando para 1.0
significa que apenas as colunas que incluem 0 lacunas (inserções / exclusões internas) serão
atribuído como consenso.
--fragthresh
Queremos apenas contar as lacunas terminais como exclusões se a sequência alinhada for conhecida
ser de comprimento total, não se for um fragmento (por exemplo, porque apenas parte dele
foi sequenciado). HMMER usa uma regra simples para inferir fragmentos: se o comprimento da sequência
L é menor ou igual a uma fração vezes o comprimento do alinhamento em colunas,
então a sequência é tratada como um fragmento. O padrão é 0.5. Configuração
--fragthresh0 irá definir nenhuma sequência (não vazia) como um fragmento; você pode querer
faça isso se você sabe que tem um alinhamento cuidadosamente selecionado de comprimento total
sequências. Configuração --fragthresh1 irá definir todas as sequências como fragmentos; você pode
deseja fazer isso se você sabe que seu alinhamento é inteiramente composto de fragmentos, como
conforme traduzido, leituras curtas em dados de espingarda metagenômica.
OPÇÕES CONTROLANDO RELATIVO PESOS
O HMMER usa um algoritmo de ponderação de sequência ad hoc para reduzir o peso de sequências intimamente relacionadas
e aumentar o peso dos parentes distantes. Isso tem o efeito de tornar os modelos menos enviesados por
representação filogenética desigual. Por exemplo, duas sequências idênticas normalmente
cada um recebe metade do peso que uma sequência receberia. Essas opções controlam quais
algoritmo é usado.
--wpb Use o esquema de ponderação de sequência baseado em posição de Henikoff [Henikoff e Henikoff,
J. Mol. Biol. 243: 574, 1994]. Este é o padrão.
--wgsc Use o algoritmo de ponderação Gerstein / Sonnhammer / Chothia [Gerstein et al, J. Mol.
Biol. 235: 1067, 1994].
--wblosum
Use o mesmo esquema de agrupamento que foi usado para ponderar os dados no cálculo do BLOSUM
matrizes de substituição [Henikoff e Henikoff, Proc. Natl. Acad. Sci 89: 10915].
As sequências são agrupadas de link único em um limite de identidade (padrão 0.62; consulte
--largura) e dentro de cada grupo de sequências c, cada sequência obtém peso relativo
1 / c.
- um
Sem pesos relativos. Todas as sequências recebem peso uniforme.
--largura
Define o limite de identidade usado por cluster de ligação única ao usar --wblosum.
Inválido com qualquer outro esquema de ponderação. O padrão é 0.62.
OUTROS OPÇÕES
--informar
Declare que a entrada arquivo msa está em formato . Atualmente o múltiplo aceito
formatos de arquivo de sequência de alinhamento incluem Stockholm, Aligned FASTA, Clustal, NCBI
PSI-BLAST, PHYLIP, Selex e UCSC SAM A2M. O padrão é detectar automaticamente o formato de
o arquivo.
--semente
Semeie o gerador de números aleatórios com , um inteiro> = 0. Se é diferente de zero, qualquer
simulações estocásticas serão reproduzíveis; o mesmo comando dará o mesmo
resultados. Se é 0, o gerador de números aleatórios é semeado arbitrariamente e
as simulações estocásticas variam de execução para execução do mesmo comando. O padrão
a semente é 42.
Use alimask online usando serviços onworks.net