InglêsFrancêsEspanhol

Ad


favicon do OnWorks

cmcalibrate - Online na nuvem

Execute o cmcalibrate no provedor de hospedagem gratuita OnWorks no Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

Este é o comando cmcalibrate que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

PROGRAMA:

NOME


cmcalibrar - ajustar caudas exponenciais para a determinação do valor E do modelo de covariância

SINOPSE


cmcalibrar [opções] arquivo cm

DESCRIÇÃO


cmcalibrar determina os parâmetros de cauda exponencial para a determinação do valor E por meio da geração
sequências aleatórias, pesquisando-as com o CM e coletando as pontuações do
exitos. Um histograma das pontuações de bits dos acertos é adequado para uma cauda exponencial, e o
os parâmetros da cauda ajustada são salvos no arquivo CM. Os parâmetros da cauda exponencial
são então usados ​​para estimar a significância estatística dos resultados encontrados em cmsearch e
cmscan.

Um arquivo CM deve ser calibrado com cmcalibrar antes que possa ser usado em cmsearch or cmscan,
com uma única exceção: não é necessário calibrar os arquivos CM que incluem apenas
modelos com zero pares de bases antes de executar cmpesquisa.

cmcalibrar é muito lento. Leva algumas horas para calibrar um único tamanho médio
CM em uma única CPU. cmcalibrar será executado em paralelo em todos os núcleos disponíveis se Infernal
foi construído em um sistema que suporta threading POSIX (consulte a seção Instalação do
guia do usuário para mais informações). Usando núcleos resultarão em aproximadamente -dobra
aceleração versus uma única CPU. MPI (Message Passing Interface) também pode ser usado para
paralelização com o --mpi opção se Infernal foi construído com MPI habilitado, mas usando
mais de 161 processadores não é recomendado porque aumentar além de 161 não acelera
a calibração. Consulte a seção Instalação do guia do usuário para obter mais informações.

A --previsão opção pode ser usada para estimar quanto tempo o programa levará para ser executado por um
dado arquivo cm na máquina atual. Para prever o tempo de execução em processadores com
MPI, use adicionalmente o --nforecast opção.

As sequências aleatórias pesquisadas em cmcalibrar são gerados por um HMM que foi treinado em
sequências genômicas reais com vários conteúdos de GC. O objetivo é ter as distribuições GC
nas sequências aleatórias sejam semelhantes às das sequências genômicas reais.

Quatro rodadas de pesquisas e subsequentes ajustes de cauda exponenciais são realizados, um para cada
os quatro algoritmos CM diferentes que podem ser usados ​​em cmsearch e cmscan: global CYK,
glocal Inside, local CYK e local Inside.

Os parâmetros de valores E determinados por cmcalibrar são usados ​​apenas pelo cmsearch e cmscan
programas. Se você não vai usar esses programas, não perca tempo calibrando
seus modelos.

OPÇÕES


-h Ajuda; imprimir um breve lembrete do uso da linha de comando e das opções disponíveis.

-L Defina o comprimento total das sequências aleatórias para pesquisar megabases (Mb). Por
padrão is 1.6 Mb. Aumentando fará com que a cauda exponencial se ajuste mais
preciso e os valores E são mais precisos, mas demoram mais (dobrando será aproximadamente
o dobro do tempo de execução). Decrescente não é recomendado, pois fará com que o
ajusta-se menos preciso e os valores E menos precisos.

OPÇÕES PARA PREVISÃO É REQUERIDO TIME E MEMÓRIA


--previsão
Prever o tempo de execução da calibração de arquivo cm (com opções fornecidas) em
a máquina atual e saia. A calibração não é realizada. As predições
devem ser consideradas estimativas aproximadas. Se o multithreading estiver habilitado (veja
Seção de instalação do guia do usuário), o tempo levará em consideração o número
de núcleos disponíveis.

--nforecast
Com o --previsão, especifique isso processadores serão usados ​​para a calibração.
Isso pode ser útil para prever o tempo de execução de um MPI executado com
processadores.

--memreq
Preveja a quantidade de memória necessária para calibrar arquivo cm (com fornecido
opções) na máquina atual e saia. A calibração não é realizada.

OPÇÕES CONTROLANDO EXPONENCIAL CAUDA ENCAIXA


--gtailn
encaixe a cauda exponencial para dentro glocal e CYK glocal para o maiores pontuações
na cauda do histograma, onde is vezes o número de Mb pesquisado. o
valor padrão de é 250. O valor 250 foi escolhido porque funciona bem
empiricamente em relação a outros valores.

--ltailn
ajustar a cauda exponencial para o interior local e o CYK local para o maiores pontuações
na cauda do histograma, onde is vezes o número de Mb pesquisado. o
valor padrão de é 750. O valor 750 foi escolhido porque funciona bem
empiricamente em relação a outros valores.

--tailp
Ignore o --gtailn e --ltailn opções prefixadas e ajustam-se ao cauda de fração de
o histograma para uma cauda exponencial, para todos os modos de pesquisa.

OPCIONAL SAÍDA ARQUIVOS


--hfile
Salve os histogramas ajustados ao arquivo . O formato deste arquivo é de dois espaços
colunas delimitadas por linha. A primeira coluna são os valores do eixo x das pontuações de bits de
cada caixa. A segunda coluna são os valores do eixo y do número de ocorrências por bin. Cada
a série é delimitada por uma linha com um único caractere "&". O arquivo conterá
uma série para cada uma das quatro caudas exponenciais se encaixa na seguinte ordem:
glocal CYK, glocal Inside, local CYK e local Inside.

--sarquivo
Salvar as informações do gráfico de sobrevivência em um arquivo . O formato deste arquivo é de dois espaços
colunas delimitadas por linha. A primeira coluna são os valores do eixo x das pontuações de bits de
cada caixa. A segunda coluna são os valores do eixo y da fração de ocorrências que atendem ou
exceder a pontuação para cada caixa. Cada série é delimitada por uma linha com um único
personagem "&". O arquivo conterá três séries de dados para cada um dos quatro CM
modos de pesquisa na seguinte ordem: glocal CYK, glocal Inside, local CYK e
local dentro. A primeira série é o gráfico de sobrevivência empírico do histograma
de acertos para a sequência aleatória. A segunda série é a cauda exponencial adequada para
a distribuição empírica. A terceira série é o ajuste de cauda exponencial se lambda
foram fixados e definidos como o logarítmico natural de 2 (0.691314718).

--qqarquivo
Salvar as informações do gráfico quantil-quantil para o arquivo . O formato deste arquivo é
duas colunas delimitadas por espaço por linha. A primeira coluna são os valores do eixo x, e
a segunda coluna são os valores do eixo y. A distância dos pontos do
linha de identidade (y = x) é uma medida de quão bom é o ajuste da cauda exponencial, o
mais próximos os pontos estão da linha de identidade, melhor será o ajuste. Cada série é
delimitado por uma linha com um único caractere "&". O arquivo conterá uma série
de dados empíricos para cada uma das quatro cauda exponencial se encaixa no seguinte
ordem: glocal CYK, glocal Inside, local CYK e local Inside.

--file
Salvar estatísticas delimitadas por espaço de diferentes ajustes de cauda exponencial para o arquivo .
O arquivo conterá os valores lambda e mu para caudas exponenciais ajustadas a
caudas do histograma de tamanhos diferentes. Os campos do arquivo são rotulados
informativamente.

--xarquivo
Salve uma lista das pontuações em cada ajuste da cauda do histograma para o arquivo . Cada linha de
este arquivo terá uma pontuação diferente, indicando que existia um acerto na cauda com
essa pontuação. Cada série é delimitada por uma linha com um único caractere "&". o
arquivo conterá uma série para cada um dos quatro ajustes de cauda exponencial no
seguinte ordem: glocal CYK, glocal Inside, local CYK e local Inside.

OUTROS OPÇÕES


--semente
Semeie o gerador de números aleatórios com , um inteiro> = 0. Se é diferente de zero,
simulações estocásticas serão reproduzíveis; o mesmo comando dará o mesmo
resultados. Se é 0, o gerador de números aleatórios é semeado arbitrariamente e
as simulações estocásticas variam de execução para execução do mesmo comando. O padrão
a semente é 181.

--beta
Por padrão, a banda dependente de consulta (QDB) é usada para acelerar a pesquisa do CM
algoritmos com probabilidade de perda da cauda beta de 1E-15. Este valor beta pode ser
alterado para com --beta . O parâmetro beta é a quantidade de probabilidade
massa excluída durante o cálculo da banda, valores mais altos de beta fornecem maiores acelerações
mas sacrifique mais precisão do que valores mais baixos. O valor padrão usado é 1E-15.
(Para obter mais informações sobre QDB, consulte Nawrocki e Eddy, PLoS Computational Biology
3(3): e56.)

- sem faixas
Desligue o QDB durante a calibração do valor E. Isso tornará a calibração mais lenta.

--nonnull3
Desative o modelo nulo adicional post hoc null3. Isso não é recomendado a menos
você planeja usar a mesma opção para cmsearch e / ou cmscan.

--aleatória
Use o modelo nulo de fundo do CM para gerar as sequências aleatórias, em vez
do HMM mais realista. A menos que o CM tenha sido construído usando o --nulo opção para
cmconstruir, o modelo nulo de fundo será de 25% cada A, C, G e U.

--gc
Gere as sequências aleatórias usando a distribuição de nucleotídeos da sequência
lima .

--CPU
Especifique isso trabalhadores de CPU paralelos sejam usados. Se é definido como "0", então o
o programa será executado em modo serial, sem usar threads. Você também pode controlar
este número definindo uma variável de ambiente, INFERNAL_NCPU. Esta opção irá
só estará disponível se a máquina em que o Infernal foi construído for capaz de usar
Rosqueamento POSIX (consulte a seção Instalação do guia do usuário para mais
em formação).

--mpi Execute como um programa paralelo MPI. Esta opção só estará disponível se Infernal tiver
foi configurado e construído com o sinalizador "--enable-mpi" (veja a Instalação
seção do guia do usuário para obter mais informações).

Use cmcalibrate online usando serviços onworks.net


Servidores e estações de trabalho gratuitos

Baixar aplicativos Windows e Linux

Comandos Linux

Ad