InglêsFrancêsEspanhol

Ad


favicon do OnWorks

minimapa - Online na nuvem

Execute o minimapa no provedor de hospedagem gratuita OnWorks no Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

Este é o minimapa de comando que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

PROGRAMA:

NOME


minimapa - mapeamento rápido entre longas sequências de DNA

SINOPSE


minimapa [-lSOV] [-k km] [-w winSize] [-I tamanho do batch] [-d despejar arquivo] [-f OccThres] [-r
largura de banda] [-m minCompartilhado] [-c contagem mínima] [-L minMatch] [-g maxGap] [-T poeiraThres] [-t
nThreads] [-x predefinido] alvo.fa consulta.fa > saída.paf

DESCRIÇÃO


Minimap é uma ferramenta para encontrar com eficiência várias posições de mapeamento aproximadas entre dois
conjuntos de sequências longas, como entre leituras e genomas de referência, entre genomas e
entre longas leituras barulhentas. O minimapa possui uma fase de indexação e mapeamento. Na indexação
fase, ele coleta todos os minimizadores de um grande lote de sequências de destino em uma tabela hash; no
a fase de mapeamento, ele identifica bons clusters de acertos do minimizador colinear. Minimapa faz
não gerar alinhamentos detalhados entre o destino e as sequências de consulta. É só
produz o início aproximado e as coordenadas finais desses clusters.

OPÇÕES


Indexação opções
-k INT Comprimento de k-mer do minimizador [15]

-w INT Tamanho da janela do minimizador [2/3 do comprimento k-mer]. Um minimizador é o menor k-mer
em uma janela de w k-mers consecutivos.

-I NUM Carregue no máximo NUM almeje bases em RAM para indexação [4G]. Se houver mais de
NUM bases em alvo.fa, o minimapa precisa ler consulta.fa várias vezes para mapeá-lo
contra cada lote de sequências alvo. NUM pode terminar com k / K / m / M / g / G.

-d ARQUIVO Despejar o índice do minimizador para ARQUIVO [sem despejo]

-l Indique aquilo alvo.fa é na verdade um índice minimizador gerado por opção -d, não
um arquivo FASTA ou FASTQ.

Mapeamento opções
-f FLOAT Ignorar top FLOAT fração da maioria dos minimizadores de ocorrência [0.001]

-r INT A largura de banda aproximada para o minimizador inicial atinge o agrupamento [500]. UMA minimizador
acertar é um minimizador presente nas sequências de destino e de consulta. UMA minimizador
acertar cacho é um grupo de acertos de minimizador potencialmente colineares entre um alvo
e uma sequência de consulta.

-m FLOAT Mescle os clusters de acertos do minimizador inicial se FLOAT ou fração superior de minimizadores
são compartilhados entre os clusters [0.5]

-c INT Reter um cluster de hit minimizador se ele contiver INT ou mais acessos de minimizador [4]

-L INT Descarte um cluster de acerto de minimizador se, após a colinearização, o número de correspondências
bases está abaixo INT [40]. Essa opção reduz principalmente o tamanho da saída. Tem
pouco efeito na velocidade e no pico de memória.

-g INT Divida um cluster de acerto de minimizador em uma lacuna INT-bp ou mais que não contém
quaisquer acertos do minimizador [10000]

-T INT Máscara regiões em sequências de consulta com limite de pontuação SDUST INT; 0 para desativar
[0]. SDUST é um algoritmo para identificar subsequências de baixa complexidade. Não é
habilitado por padrão. Se SDUST for preferido, um valor entre 20 e 25 é
recomendado. Um limite mais alto mascara menos sequências.

-S Execute o mapeamento tudo-contra-tudo. Neste modo, se o nome da sequência de consulta for
lexicograficamente maior do que o nome da sequência de destino, os acertos entre eles
será suprimido; se o nome da sequência de consulta for igual ao nome do destino,
os acertos do minimizador diagonal também serão suprimidos.

-O Solte um acerto do minimizador se ele estiver longe de outros acertos (EXPERIMENTAL). Esse
opção é útil para mapear cromossomos longos de duas espécies divergentes.

-x STR Alterar várias configurações com base em STR [não configurado]. Recomenda-se aplicar
esta opção antes de outras opções, de modo que as seguintes opções podem substituir
as múltiplas configurações modificadas por esta opção.

ava10k para mapeamento de leitura tudo-contra-tudo do PacBio ou Oxford Nanopore (-Sw5 -L100 -m0).

Input / output opções
-t INT Número de threads [3]. O minimapa usa no máximo três threads ao coletar
minimizadores nas sequências alvo e usa até INT+1 tópicos ao mapear (o
thread extra é para E / S, que frequentemente fica ociosa e leva pouco tempo de CPU).

-V Imprimir o número da versão em stdout

SAÍDA FORMATO


O minimapa exibe as posições de mapeamento no Pairwise mApping Format (PAF). PAF é um TAB-
formato de texto delimitado com cada linha consistindo em pelo menos 12 campos, conforme descrito em
a seguinte tabela:

┌─────┬─────────┬────────────────────────────────────── ──────────────────────────────┐
ColFormatoDescrição
├─────┼─────────┼────────────────────────────────────── ──────────────────────────────┤
│ 1 │ string │ Nome da sequência de consulta │
│ 2 │ int │ Comprimento da sequência de consulta │
│ 3 │ int │ Coordenada de início da consulta (base 0) │
│ 4 │ int │ Coordenada final da consulta (base 0) │
│ 5 │ char │ `+ 'se consulta e destino na mesma vertente; `- 'se oposto │
│ 6 │ string │ Nome da sequência alvo │
│ 7 │ int │ Comprimento da sequência alvo │
│ 8 │ int │ Coordenada de início do objetivo na fita original │
│ 9 │ int │ Coordenada final alvo na fita original │
│ 10 │ int │ Número de bases correspondentes no mapeamento │
│ 11 │ int │ Bases numéricas, incluindo lacunas, no mapeamento │
│ 12 │ int │ Qualidade de mapeamento (0-255 com 255 em falta) │
└─────┴─────────┴────────────────────────────────────── ──────────────────────────────┘

Quando o alinhamento está disponível, a coluna 11 dá o número total de correspondências de sequência,
incompatibilidades e lacunas no alinhamento; coluna 10 dividida pela coluna 11 dá o alinhamento
identidade. Como o minimapa não gera alinhamento detalhado, essas duas colunas são
aproximado. O PAF pode opcionalmente ter campos adicionais no valor-chave digitado semelhante ao SAM
formato. O minimapa grava o número de ocorrências do minimizador em um cluster na tag cm.

Use minimapa online usando serviços onworks.net


Servidores e estações de trabalho gratuitos

Baixar aplicativos Windows e Linux

Comandos Linux

Ad