Este é o comando rabema_evaluate que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
rabema_evaluate - Avaliação RABEMA
SINOPSE
rabema_avaluate [OPÇÕES] --referência REF.fa --in-gsi IN.gsi --in-sam MAPEAMENTO.sam
rabema_avaluate [OPÇÕES] --referência REF.fa --in-gsi IN.gsi --in-bam MAPEAMENTO.bam
DESCRIÇÃO
Compare a saída do SAM / bam MAPPING.sam / MAPPING.bam de qualquer mapeador de leitura com o
Padrão ouro RABEMA previamente construído com rabema_build_gold_standard. A entrada é
um arquivo FASTA de referência, um arquivo de intervalo padrão ouro (GSI) e a entrada SAM / BAM
avaliar.
O arquivo SAM / BAM de entrada deve ser classificado por queryname. O programa criará um FASTA
arquivo de índice REF.fa.fai para acesso aleatório rápido à referência.
-h, --Socorro
Exibe esta mensagem de ajuda.
--versão
Exibir informações de versão
-v, --verbose
Ative a saída detalhada.
-vv, --muito verboso
Habilite uma saída ainda mais detalhada.
Entrada / Saída:
-r, --referência RÁPIDO
Caminho para carregar o FASTA de referência. Os tipos de arquivos válidos são: fa e fasta.
-g, --in-gsi GSI
Caminho para carregar os intervalos do padrão ouro. Se compactado usando gzip, o arquivo irá
ser descompactado em tempo real. Os tipos de arquivos válidos são: gsi e gsi.gz.
-s, --in-sam SAM
Caminho para carregar a saída do SAM do mapeador de leitura. O tipo de arquivo válido é: sam.
-b, --in-bam BAM
Caminho para carregar a saída BAM do mapeador de leitura. O tipo de arquivo válido é: bam.
--out-tsv TSV
Caminho para gravar as estatísticas como TSV. O tipo de arquivo válido é: tsv.
Parâmetros de referência:
--modo oracle
Ative o modo oracle. Isso é usado para dados simulados quando o arquivo GSI de entrada fornece
exatamente uma posição que é considerada como a posição de amostra verdadeira. Para simulado
dados.
--only-unique-leituras
Considere ler apenas um único alinhamento no arquivo de resultado do mapeamento. Útil para
computação de precisão.
--match-N
Quando definido, N corresponde a todos os caracteres sem penalidade.
--métrica de distância METRIC
Defina a métrica de distância. Valores válidos: hamming, edit. Padrão: editar. Um de hamming e
editar. Padrão: editar.
-e, --max-erro TAXA
Taxa de erro máxima para construir o padrão ouro em porcentagem. Este parâmetro é um
inteiro e relativo ao comprimento de leitura. A taxa de erro é ignorada no modo oracle,
aqui, a distância da leitura na posição da amostra é tomada, individualmente para
cada leitura. Padrão: 0 Padrão: 0.
-c, --benchmark-categoria CAT
Defina a categoria de referência. Um de {tudo, tudo de melhor, qualquer melhor. Padrão: todos um de todos,
tudo de melhor e tudo de melhor. Padrão: tudo.
--trust-NM
Quando definido, nós confiamos no alinhamento e distância do arquivo SAM / BAM e nenhum realinhamento
é realizado. Desligado por padrão.
--ignore-pareado-sinalizadores
Quando definido, ignoramos todos os sinalizadores SAM / BAM relacionados ao emparelhamento. Isso é necessário quando
analisando o SAM do script soap2sam.pl do SOAP.
- NÃO PÂNICO
Não interrompa a execução do programa se um hit adicional for encontrado que indica que
o padrão ouro está incorreto.
Exploração madeireira:
--mostrar intervalos perdidos
Mostra os detalhes de cada intervalo perdido do GSI.
--show-sucessos inválidos
Mostrar detalhes para hits inválidos (com taxa de erro muito alta).
--show-hits adicionais
Mostrar detalhes para acertos adicionais (taxa de erro baixa o suficiente, mas não no padrão ouro.
--show-hits
Mostrar detalhes para intervalos de hit.
--show-tente-acertar
Mostra os detalhes de cada alinhamento na entrada SAM / BAM.
A ocorrência de acertos "inválidos" na saída do mapeador de leitura não é um erro. Se
há acertos adicionais, no entanto, isso mostra um erro no padrão ouro.
VALORES DE RETORNO
Um valor de retorno de 0 indica sucesso, qualquer outro valor indica um erro.
REQUISITOS DE MEMÓRIA
A partir da versão 1.1, muito cuidado foi tomado para manter os requisitos de memória tão baixos
quanto possível.
A etapa de avaliação precisa armazenar toda a sequência de referência na memória, mas
um pouco mais de memória. Portanto, para o genoma humano, os requisitos de memória estão abaixo de 4
GB, independentemente do tamanho do arquivo GSI ou SAM / BAM.
REFERÊNCIAS
M. Holtgrewe, A.-K. Emde, D. Weese e K. Reinert. Um romance e bem definido
Método de benchmarking para mapeamento de leitura de segunda geração, BMC Bioinformatics 2011,
12: 210.
http://www.seqan.de/rabema
Página inicial da RABEMA
http://www.seqan.de/mason
Página inicial do pedreiro
VERSÃO
rabema_evaluate version: 1.2.0 Última atualização 14 de março de 2013
Use rabema_evaluate online usando serviços onworks.net