Este é o comando cmemit que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
cmemit - sequências de amostra de um modelo de covariância
SINOPSE
cmemitir [opções]
DESCRIÇÃO
O cmemitir programa amostras (emite) sequências do (s) modelo (s) de covariância em , e
grava-os na saída. As sequências de amostragem podem ser úteis para uma variedade de propósitos,
incluindo a criação de verdadeiros positivos sintéticos para benchmarks ou testes.
O padrão é amostrar dez sequências não alinhadas de cada CM. Alternativamente, com o -c
opção, você pode emitir uma única sequência de consenso de regra da maioria; ou com o -a opção, você
pode emitir um alinhamento.
O pode conter uma biblioteca de CMs, caso em que cada CM será usado separadamente.
pode ser '-' (traço), o que significa ler esta entrada de stdin em vez de um arquivo.
Para modelos com pares de base zero, as sequências são amostradas a partir do filtro HMM de perfil em vez disso
do CM. No entanto, uma vez que esses modelos serão quase idênticos (a menos que opções especiais
foram usados em cmconstruir para evitar isso), usar o HMM em vez do CM não mudará o
saída de forma significativa, a menos que o -l opção é usada. Com -eu, o HMM será
configurado para posições de início e fim de modelo equiprováveis, enquanto o CM não. Você pode
força cmemitir sempre amostrar do CM com o --nohmmonly opção.
OPÇÕES
-h Ajuda; imprimir um breve lembrete do uso da linha de comando e das opções disponíveis.
-o Salve as sequências sintéticas em um arquivo em vez de gravá-los no stdout.
-N Gerar sequências. O valor padrão para é 10.
-u Escreva as sequências geradas em formato não alinhado (FASTA). Este é o padrão
comportamento.
-a Escreva as sequências geradas em um formato alinhado (ESTOCOLMO) com consenso
estrutura de anotação em vez de FASTA. Outros formatos de saída são possíveis com o
--formato opção.
-c Prever uma única sequência de consenso de regra da maioria em vez de sequências de amostragem
da distribuição de probabilidade do CM. Resíduos altamente conservados (par de base
resíduos que pontuam mais do que 3.0 bits, ou resíduos de fita simples que pontuam
maior que 1.0 bits) são mostrados em maiúsculas; outros são mostrados em letras minúsculas.
-e Incorporar as sequências emitidas por CM em uma sequência maior de comprimento gerada aleatoriamente
gerado a partir de um HMM que foi treinado em sequências genômicas reais com vários
Conteúdo GC (o mesmo HMM usado por cmcalibrar). Você pode usar o --iid opção para
gere 25% da sequência A, C, G e U em vez disso. A sequência CM emitida começará
em uma posição aleatória dentro da sequência maior e será incluído em seu
inteiramente, a menos que o --u5p or --u3p opções são usadas. Quando -e é utilizado em
combinação com --u5p, a sequência CM emitida sempre começará na posição 1 de
a sequência maior e será truncada em 5 '. Quando usado em combinação --u3p o CM
a sequência emitida sempre terminará na posição da sequência maior e será
3 'truncado.
-l Configure os CMs no modo local antes de emitir sequências. Por padrão, o modelo
estará no modo global. No modo local, grandes inserções e exclusões são mais
comum do que no modo global.
OPÇÕES PARA TRUNCANDO EMITIDO SEQUÊNCIAS
--u5p Truncar todas as sequências emitidas em uma posição inicial escolhida aleatoriamente , por apenas
produzindo resíduos começando em . Um ponto de partida diferente é escolhido aleatoriamente
para cada sequência.
--u3p Truncar todas as sequências emitidas em uma posição final escolhida aleatoriamente , por apenas
saída de resíduos até a posição . Um ponto final diferente é escolhido aleatoriamente
para cada sequência.
--a5p
Em combinação com o -a opção, truncar o alinhamento emitido aleatoriamente
posição de partida escolhida , emitindo apenas colunas de alinhamento para as posições
após o estado da partida - 1. deve ser um número inteiro entre 0 e o consenso
comprimento do modelo (que pode ser determinado usando o cmstat programa. Como um especial
caso, usando 0 como resultará em uma posição inicial escolhida aleatoriamente.
--a3p
Em combinação com o -a opção, truncar o alinhamento emitido aleatoriamente
posição de finalização escolhida , emitindo apenas colunas de alinhamento para as posições
antes do estado da partida + 1. deve ser um número inteiro entre 1 e o consenso
comprimento do modelo (que pode ser determinado usando o cmstat programa). Como um
caso especial, usando 0 como resultará em uma posição final escolhida aleatoriamente.
OUTROS OPÇÕES
--semente
Semeie o gerador de números aleatórios com , um inteiro> = 0. Se é diferente de zero,
a amostragem estocástica de sequências será reproduzível; o mesmo comando dará
os mesmos resultados. Se é 0, o gerador de números aleatórios é semeado arbitrariamente,
e as amostragens estocásticas variam de execução para execução do mesmo comando. o
a semente padrão é 0.
--iid Com -e gere as sequências maiores como 25% cada A, C, G e U.
--rna Especifique que as sequências emitidas sejam geradas como sequências de RNA. Isso é verdade por
padrão.
--dna Especifique que as sequências emitidas sejam geradas como sequências de DNA. Por padrão, o
alfabeto de saída é RNA.
--idx
Especifique que as sequências emitidas sejam nomeadas começando com . . By
omissão é 1.
--formato
Com -uma, especificar o formato de alinhamento de saída como . Os formatos aceitáveis são: Pfam,
AFA, A2M, Clustal e Phylip. AFA é fasta alinhado. Apenas Pfam e Estocolmo
formatos de alinhamento incluirão anotações de estrutura de consenso.
--tfile
Despeje parsetrees de sequência tabular (tracebacks) para cada sequência emitida para o arquivo
. Principalmente útil para depuração.
--exp
Exponencialmente as probabilidades de emissão e transição do CM por e depois
renormalize essas distribuições antes de emitir sequências. Esta opção muda o
Distribuição de probabilidade CM de parsetrees em relação à inadimplência. Com menos que
1.0 as sequências emitidas tenderão a ter pontuações de bits mais baixas após o alinhamento com o
CM. Com maior que 1.0, as sequências emitidas tenderão a ter bit mais alto
pontuações após o alinhamento ao CM. Esta diferença de pontuação de bits aumentará conforme
afasta-se ainda mais de 1.0 em qualquer direção. Se é igual a 1.0, esta opção
não tem efeito em relação ao padrão. Esta opção é útil para gerar sequências
que são mais difíceis ( <1.0) ou mais fácil ( > 1.0) para o CM para
distinguir como homóloga da sequência aleatória de fundo.
--hummmente
Emita do perfil de filtro HMM em vez do CM.
--nohmmonly
Nunca emita do perfil de filtro HMM, use sempre o CM, mesmo para modelos com
zero pares de base.
Use cmemit online usando serviços onworks.net