Este é o comando mhap que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
mhap - sobreposição de sequência probabilística
DESCRIÇÃO
Por favor, defina o -s ou de -p opções. Veja as opções abaixo: MHAP: Protocolo de alinhamento MinHash.
Uma ferramenta para encontrar sobreposições de sequências de leitura longa (como PacBio ou Nanopore) em
bioinformática.
Versão: 1.6, Tempo de construção: 09/12/2015 11:46 Uso 1 (execução direta): java
-servidor -Xmx -jar -s[-q
arquivo>] [-f ] Uso 2 (gerar pré-computado
binários): java -servidor -Xmx -jar -p
-q [-f ]
--alinhamento, padrão = falso
Opção experimental.
--alinhamento-deslocamento, padrão = -0.535
O deslocamento para contabilizar a variação na pontuação de correspondência de alinhamento.
- pontuação de alinhamento, padrão = 1.0E-6
A pontuação de corte para correspondências de alinhamento.
--filtro-limite, padrão = 1.0E-5
[duplo], o ponto de corte no qual o k-mer no arquivo de filtro k-mer é considerado
repetitivo. Este valor para um k-mer específico é especificado na segunda coluna em
o arquivo de filtro. Se nenhum arquivo de filtro for fornecido, esta opção será ignorada.
--Socorro, padrão = falso
Exibe o menu de ajuda.
--max-shift, padrão = 0.2
[double], tamanho da região à esquerda e à direita da sobreposição estimada, conforme derivado
do deslocamento médio e comprimento de sequência, onde as correspondências de k-mer ainda são
considerado válido. Filtro de segundo estágio apenas.
--min-store-length, padrão = 0
[int], O comprimento mínimo da leitura que é armazenado na caixa. Usado para filtrar
leituras curtas do arquivo FASTA.
--nanopore-rápido, padrão = falso
Defina todos os parâmetros para as configurações rápidas do Nanopore. Este é o melhor atual
orientação e pode mudar a qualquer momento sem aviso.
--não-eu, padrão = falso
Não calcule as sobreposições entre as sequências dentro de uma caixa. Deve ser usado quando o
de e para as sequências vêm de arquivos diferentes.
--num-hashes, padrão = 512
[int], número de min-mers a serem usados no MinHashing.
--num-min-partidas, padrão = 3
[int], mínimo # min-mer que deve ser compartilhado antes de calcular o filtro de segundo estágio.
Quaisquer sequências abaixo desse valor são consideradas não sobrepostas.
--num-threads, padrão = 12
[int], número de threads a serem usados para computação. Normalmente definido como 2 x #cores.
--pacbio-rápido, padrão = falso
Defina todos os parâmetros para a configuração rápida do PacBio. Este é o melhor atual
orientação e pode mudar a qualquer momento sem aviso.
--pacbio-sensível, padrão = falso
Defina todos os parâmetros para as configurações sensíveis do PacBio. Este é o melhor atual
orientação e pode mudar a qualquer momento sem aviso.
--store-id completo, padrão = falso
Armazene IDs completos conforme vistos no arquivo FASTA, em vez de armazenar apenas a sequência
posição no arquivo. Alguns arquivos FASTA têm IDS longos, tornando a produção de resultados mais lenta.
Esta opção é ignorada ao usar o formato de arquivo compactado.
--limiar, padrão = 0.04
[duplo], o limite de corte de pontuação de similaridade para o segundo estágio sort-merge
filtro. Isso é baseado no número médio de k-mers correspondentes na sobreposição
região.
--versão, padrão = falso
Exibe a versão e o tempo de construção.
--pesada, padrão = falso
Execute MinHashing ponderado.
-f, padrão = ""
Arquivo de filtro k-mer usado para filtrar k-mers altamente repetitivos. Deve ser classificado
em ordem decrescente de frequência (segunda coluna).
-h, padrão = falso
Exibe o menu de ajuda.
-k, padrão = 16
[int], tamanho k-mer usado para MinHashing. O tamanho k-mer para o filtro de segundo estágio é
separados e não podem ser modificados.
-p, padrão = ""
Uso 2 apenas. O diretório que contém os arquivos FASTA que devem ser convertidos para
formato binário para armazenamento.
-q, padrão = ""
Uso 1: O arquivo FASTA de leituras, ou um diretório de arquivos, que será comparado
o conjunto de leituras na caixa (ver -s) Uso 2: o diretório de saída para o binário
arquivos dat formatados.
-s, padrão = ""
Uso 1 apenas. O arquivo FASTA ou binário dat (ver Uso 2) de leituras que serão
armazenado em uma caixa e com as quais todas as leituras subsequentes serão comparadas.
Use mhap online usando serviços onworks.net