InglêsFrancêsEspanhol

Ad


favicon do OnWorks

maq - Online na nuvem

Execute maq no provedor de hospedagem gratuita OnWorks no Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

Este é o comando maq que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

PROGRAMA:

NOME


Maq - Mapeamento e Montagem com Qualidades

SINOPSE


mas Q comando [opções] argumentos

maq.pl comando [opções] argumentos

DESCRIÇÃO


Maq é um software que constrói assemblies de mapeamento a partir de leituras curtas geradas pelo próximo
máquinas de sequenciamento de geração. É especialmente projetado para Illumina-Solexa 1G Genetic
Analyzer e tem uma funcionalidade preliminar para lidar com dados AB SOLiD.

Com o Maq, você pode:

· Alinhamento rápido das leituras Illumina / SOLiD para o genoma de referência. Com as opções padrão, um
milhões de pares de leituras podem ser mapeados para o genoma humano em cerca de 10 horas de CPU com menos
de 1G de memória.

· Meça com precisão a probabilidade de erro do alinhamento de cada leitura individual.

· Chame os genótipos de consenso, incluindo polimorfismos homozigotos e heterozigotos, com
uma qualidade probabilística de Phred atribuída a cada base.

· Encontre indels curtos com leituras finais emparelhadas.

· Encontre com precisão eliminações e translocações genômicas em grande escala com leituras finais emparelhadas.

· Descubra CNVs potenciais verificando a profundidade de leitura.

· Avaliar a precisão das qualidades básicas brutas de sequenciadores e ajudar a verificar o
erros sistemáticos.

No entanto, Maq pode NÃO:

· Fazer de novo conjunto. (Maq só pode chamar o consenso mapeando leituras para um conhecido
referência.)

· O short do mapa é lido contra si mesmo. (Maq só pode encontrar sobreposição completa entre leituras.)

· Alinhe leituras capilares ou 454 leituras à referência. (Maq não pode alinhar leituras mais longas do que
63 bp.)

MAQ COMANDOS


Chave comandos

fasta2bfa mas Q fasta2bfa em.ref.fasta out.ref.bfa

Converta sequências no formato FASTA para o formato BFA (FASTA binário) da Maq.

fastq2bfq mas Q fastq2bfq [-n nreads] em.ler.fastq out.read.bfqout.prefixo

Converta leituras no formato FASTQ para o formato BFQ (FASTQ binário) do Maq.

OPÇÕES:

-n INT número de leituras por arquivo [não especificado]

mapa, mas Q mapa, [-n nmis] [-a maxilares] [-c] [-1 Len1] [-2 Len2] [-d adapt3] [-m mutrar]
[-u não mapeado] [-e Maxerr] [-M c⎪g] [-N] [-H tudo] [-C maxhits] out.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

O mapa lê as sequências de referência.

OPÇÕES:

-n INT Número de incompatibilidades máximas que sempre podem ser encontradas [2]

-a INT Distância externa máxima para um par de leitura correta [250]

-A INT Distância externa máxima de duas leituras de RF paied (0 para desabilitar) [0]

-c O mapa é lido no espaço de cores (apenas para SOLiD)

-1 INT Comprimento de leitura para a primeira leitura, 0 para auto [0]

-2 INT Comprimento de leitura para a segunda leitura, 0 para auto [0]

-m FLOAT Taxa de mutação entre as sequências de referência e as leituras [0.001]

-d ARQUIVO Especifique um arquivo contendo uma única linha da sequência do adaptador 3 '
[nulo]

-u ARQUIVO Descartar leituras não mapeadas e leituras contendo mais de nmis incompatibilidades com
um arquivo separado [null]

-e INT Limiar na soma das qualidades de base incompatíveis [70]

-H ARQUIVO Despejar múltiplos / todos os hits de incompatibilidade 01 para ARQUIVO [nulo]

-C INT Número máximo de ocorrências para saída. Ilimitado se maior que 512. [250]

-M c⎪g modo de alinhamento de metilação. Todos os C (ou G) na fita para a frente serão
alterado para T (ou A). Esta opção é apenas para teste.

-N armazene a posição de incompatibilidade no arquivo de saída out.aln.map. Quando isso
opção estiver em uso, o comprimento máximo de leitura permitido é 55 bp.

NOTA:

* As leituras finais emparelhadas devem ser preparadas em dois arquivos, um para cada extremidade, com
as leituras são classificadas na mesma ordem. Isso significa que a k-ésima leitura no primeiro
o arquivo é combinado com a k-ésima leitura no segundo arquivo. A leitura correspondente
os nomes devem ser idênticos até o final `/ 1 'ou` / 2'. Por exemplo, tal
par de nomes de leitura são permitidos: `EAS1_1_5_100_200 / 1 'e
`EAS1_1_5_100_200 / 2 '. O tailing `/ [12] 'é geralmente gerado pelo
GAPipeline para distinguir as duas extremidades de um par.

* A saída é um arquivo binário compactado. É afetado pelo endianness.

* A melhor maneira de executar este comando é fornecer cerca de 1 a 3 milhões de leituras como
entrada. Mais leituras consomem mais memória.

* Opção -n controla a sensibilidade do alinhamento. Por padrão, um hit com
até 2 incompatibilidades podem ser encontradas. Superior -n encontra mais resultados e também
melhora a precisão das qualidades de mapeamento. No entanto, isso é feito ao custo
de velocidade.

* Alinhamentos com muitas incompatibilidades de alta qualidade devem ser descartados como falsos
alinhamentos ou possíveis contaminações. Este comportamento é controlado por opção
-e. O -e limite só é calculado aproximadamente porque as qualidades de base
são divididos por 10 em um determinado estágio do alinhamento. o -Q opção no
montar comando definir precisamente o limite.

* Diz-se que um par de leituras está emparelhado corretamente se e somente se o
orientação é FR e a distância externa do par não é maior do que
maxilares. Não há limite para o tamanho mínimo do inserto. Esta configuração é
determinado pelo algoritmo de alinhamento final emparelhado usado em Maq. Requerendo um
o tamanho mínimo da pastilha levará a alguns alinhamentos errados com alta
qualidades de mapeamento superestimadas.

* Atualmente, os pares de leitura da biblioteca de inserção longa Illumina / Solexa têm leitura de RF
orientação. O tamanho máximo da inserção é definido por opção -A. No entanto, por muito tempo
biblioteca de inserção também é misturada com uma pequena fração de leitura de inserção curta
pares. -a também deve ser definido corretamente.

* Às vezes, a extremidade 5 'ou mesmo toda a sequência do adaptador 3' pode ser sequenciada.
Uma Experiência -d renderiza Maq para eliminar as contaminações do adaptador.

* Dados 2 milhões de leituras como entrada, mas Q normalmente ocupa 800 MB de memória.

mesclar mapa mas Q mesclar mapa out.aln.map in.aln1.map in.aln2.map [...]

Mescle um lote de alinhamentos de leitura.

NOTA:

* Em teoria, este comando pode mesclar um número ilimitado de alinhamentos. No entanto, como
mapmerge estará lendo todas as entradas ao mesmo tempo, pode atingir o
limite do número máximo de arquivos de abertura definido pelo sistema operacional. No momento, este
deve ser resolvido manualmente pelos usuários finais.

* Comando mesclar mapa pode ser usado para mesclar arquivos de alinhamento com diferentes leituras
comprimentos. Todas as análises subsequentes não assumem mais comprimento fixo.

rmdup mas Q rmdup out.rmdup.map in.ori.map

Remova pares com coordenadas externas idênticas. Em princípio, pares com
coordenadas externas idênticas devem acontecer raramente. No entanto, devido ao
amplificação na preparação da amostra, isso ocorre com muito mais frequência do que por
chance. Análises práticas mostram que remover duplicatas ajuda a melhorar o
precisão geral de chamadas SNP.

montar mas Q montar [-sp] [-m máximo] [-Q Maxerr] [-r Hetrate] [-t coef] [-q minQ] [-N
nHap] fora.cns in.ref.bfa in.aln.map 2> out.cns.log

Chame as sequências de consenso do mapeamento de leitura.

OPÇÕES:

-t FLOAT Coeficiente de dependência de erro [0.93]

-r FLOAT Fração de heterozigotos entre todos os locais [0.001]

-s Considere a qualidade do mapeamento de extremidade única como a qualidade do mapeamento final;
caso contrário, a qualidade de mapeamento final emparelhada será usada

-p Descartar leituras finais emparelhadas que não estão mapeadas em pares corretos

-m INT Número máximo de incompatibilidades permitidas para uma leitura a ser usada em
chamada de consenso [7]

-Q INT Soma máxima permitida de valores de qualidade de bases incompatíveis [60]

-q INT Qualidade mínima de mapeamento permitida para uma leitura a ser usada em consenso
ligando para [0]

-N INT Número de haplótipos no pool (> = 2) [2]

NOTA:

* Opção -Q define um limite na soma máxima de qualidades básicas incompatíveis.
As leituras que contêm muitas incompatibilidades de alta qualidade devem ser descartadas.

* Opção -N define o número de haplótipos em um pool. É projetado para
re-sequenciamento de amostras por agrupamento de várias cepas / indivíduos. Para
resequenciamento diplóide do genoma, esta opção é igual a 2.

glfgen mas Q glfgen [-sp] [-m máximo] [-Q Maxerr] [-r Hetrate] [-t coef] [-q minQ] [-N
nHap] fora.cns in.ref.bfa in.aln.map 2> out.cns.log

Calcular a probabilidade de log para todos os genótipos e armazenar os resultados no formato GLF
(Formato de probabilidade de genotipagem). Por favor, verifique o site MAQ para detalhes
descrições do formato do arquivo e utilitários relacionados.

indelé mas Q indelé in.ref.bfa in.aln.map > out.indelpe

Chame indels consistentes de leituras finais emparelhadas. A saída é delimitada por TAB com
cada linha consiste em cromossomo, posição inicial, tipo de indel, número
de leituras através do indel, tamanho do indel e nucleotídeos inseridos / deletados
(separados por dois pontos), número de indels na fita reversa, número de indels
na fita direta, sequência 5 'à frente do indel, sequência 3' seguindo
o indel, número de leituras alinhadas sem indels e três colunas adicionais
para filtros.

Na 3ª coluna, tipo do indel, uma estrela indica que o indel está confirmado
por leituras de ambas as vertentes, um sinal de mais significa que o indel é atingido por pelo menos duas leituras
mas da mesma vertente, um menos mostra que o indel só é encontrado em uma leitura,
e um ponto significa que o indel está muito próximo de outro indel e foi filtrado.

Recomenda-se aos usuários que percorram o `maq.pl indelpe 'para corrigir o número de
lê mapeado sem indels. Para obter mais detalhes, consulte o `maq.pl indelpe '
seção.

Indelsoa mas Q Indelsoa in.ref.bfa in.aln.map > out.indelsoa

Chame potenciais indels homozigotos e pontos de quebra, detectando o anormal
padrão de alinhamento em torno de indels e pontos de quebra. A saída também é TAB
delimitado com cada linha consistindo de cromossomo, coordenada aproximada,
comprimento da região anormal, número de leituras mapeadas na posição,
número de leituras no lado esquerdo da posição e número de leituras no
o lado direito. A última coluna pode ser ignorada.

A saída contém muitos falsos positivos. Um filtro recomendado pode ser:

awk '$ 5 + $ 6- $ 4> = 3 && $ 4 <= 1' in.indelsoa

Observe que este comando não visa ser um detector indel preciso, mas
principalmente ajuda a evitar alguns falsos positivos na chamada de substituição. No
Além disso, ele só funciona bem em profundidades profundas (~ 40X por exemplo); caso contrário, o
a taxa de falsos negativos seria muito alta.

Formato Convertendo

sol2sanger mas Q sol2sanger in.sol.fastq out.sanger.fastq

Converta Solexa FASTQ para o formato padrão / Sanger FASTQ.

bfq2fastq mas Q bfq2fastq em.ler.bfq out.read.fastq

Converta o formato BFQ da Maq para o formato FASTQ padrão.

mapas2maq mas Q mapas2maq in.mapass2.map out.maq.map

Converta o formato de mapa obsoleto do mapass2 para o formato de mapa do Maq. O formato antigo faz
não contém nomes lidos.

Dados Pessoais Extraindo

visão do mapa mas Q visão do mapa [-bN] in.aln.map > out.aln.txt

Exibe o alinhamento lido em texto simples. Para leituras alinhadas antes do Smith-
Alinhamento Waterman, cada linha consiste em ler o nome, cromossomo, posição,
vertente, insira o tamanho das coorniates externas de um par, bandeira emparelhada, mapeamento
qualidade, qualidade de mapeamento de ponta única, qualidade de mapeamento alternativo, número de
incompatibilidades do melhor acerto, soma das qualidades das bases incompatíveis dos melhores
hit, número de ocorrências de incompatibilidade 0 dos primeiros 24 bp, número de ocorrências de incompatibilidade 1 de
os primeiros 24 bp na referência, comprimento da leitura, sequência de leitura e seu
qualidade. A qualidade do mapeamento alternativa sempre é igual à qualidade do mapeamento se o
leituras não estão emparelhadas. Se as leituras estiverem emparelhadas, é igual ao mapeamento menor
qualidade das duas extremidades. Esta qualidade de mapeamento alternativa é, na verdade, o
mapeamento de qualidade de um par anormal.

A quinta coluna, sinalizador emparelhado, é um sinalizador bit a bit. Seus 4 bits inferiores dão o
orientação: 1 representa FF, 2 para FR, 4 para RF e 8 para RR, onde FR significa
que a leitura com coordenada menor está na fita para a frente, e seu companheiro é
na fita reversa. Apenas FR é permitido para um par correto. Os bits mais altos
desta bandeira fornecem mais informações. Se o par encontra o lado pareado
requisito, 16 serão definidos. Se as duas leituras são mapeadas para diferentes
cromossomos, 32 serão definidos. Se uma das duas leituras não puder ser mapeada,
64 será definido. A bandeira de um par correto sempre é igual a 18.

Para leituras alinhadas pelo alinhamento Smith-Waterman posteriormente, a bandeira é
sempre 130. Uma linha consiste em ler o nome, cromossomo, posição, vertente, inserção
tamanho, bandeira (sempre 130), posição do indel na leitura (0 se não houver indel),
comprimento dos indels (positivo para inserções e negativo para deleções),
qualidade de mapeamento de seu parceiro, número de incompatibilidades do melhor acerto, soma de
qualidades de bases incompatíveis do melhor acerto, dois zeros, comprimento da leitura,
leia a sequência e sua qualidade. O companheiro de uma leitura marcada com 130 sempre obtém um
bandeira 18.

O sinalizador 192 indica que a leitura não está mapeada, mas seu mate está mapeado. Por tal
um par de leitura, uma leitura tem o sinalizador 64 e a outra tem 192.

OPÇÕES:

-b não exibe a sequência de leitura e a qualidade

-N exibir as posições onde ocorrem incompatibilidades. Este sinalizador só funciona
com um arquivo .map gerado por `maq map -N '.

verificação de mapa mas Q verificação de mapa [-s] [-m máximo] [-q minQ] in.ref.bfa in.aln.map > out.mapcheck

Leia a verificação de qualidade. A verificação de mapa primeiro relata a composição e a profundidade de
A referência. Depois disso, há um formulário. A primeira coluna indica o
posição em uma leitura. Seguindo quatro colunas que mostram o nucleotídeo
composição, taxas de substituição entre a referência e as leituras serão fornecidas.
Essas taxas e os números nas colunas a seguir são escalados para 999 e
arredondado para o número inteiro mais próximo. O próximo grupo de colunas mostra a distribuição de
qualidades básicas ao longo das leituras em um intervalo de qualidade de 10. Uma queda na qualidade
geralmente podem ser observados, o que significa que as bases no final da leitura são menos
preciso. O último grupo de colunas apresenta a fração de substituições para
ler bases em um intervalo de qualidade. Isso mede a precisão da qualidade base
estimativa. Idealmente, esperamos ver 1 em 3? coluna, 10 na 2? coluna
e 100 no 1? coluna.

OPÇÕES:

-s Considere a qualidade de mapeamento de extremidade única como a qualidade de mapeamento final

-m INT Número máximo de erros permitidos para uma leitura ser contada [4]

-q INT Qualidade mínima de mapeamento permitida para uma leitura ser contada [30]

empilhar mas Q empilhar [-spvP] [-m máximo] [-Q Maxerr] [-q minQ] [-l arquivo do site] in.ref.bfa
in.aln.map > out.pileup

Exibe o alinhamento em formato de texto `pileup '. Cada linha consiste em
cromossomo, posição, base de referência, profundidade e as bases nas leituras dessa capa
Este cargo. Se -v é adicionado na linha de comando, qualidades básicas e mapeamento
qualidades serão apresentadas na sexta e sétima colunas na ordem.

A quinta coluna sempre começa com `@ '. Nesta coluna, leia bases idênticas
à referência são mostrados na vírgula `, 'ou ponto`.', e leem bases diferentes
da referência em letras. Uma vírgula ou maiúscula indica que a base
vem de uma leitura alinhada na vertente dianteira, enquanto um ponto ou minúscula em
a fita reversa.

Este comando é para usuários que desejam desenvolver seus próprios chamadores SNP.

OPÇÕES:

-s Considere a qualidade de mapeamento de extremidade única como a qualidade de mapeamento final

-p Descartar leituras finais emparelhadas que não são mapeadas como pares corretos

-v Informações detalhadas de saída, incluindo qualidades básicas e mapeamento
qualidades

-m INT Número máximo de incompatibilidades permitidas para que uma leitura seja usada [7]

-Q INT Número máximo permitido de valores de qualidade de incompatibilidades [60]

-q INT Qualidade mínima de mapeamento permitida para uma leitura a ser usada [0]

-l ARQUIVO Arquivo contendo os locais nos quais o pileup será impresso. Nisso
arquivo a primeira coluna dá os nomes da referência e o segundo
as coordenadas. Colunas adicionais serão ignoradas. [nulo]

-P também exibe a posição base na leitura

cns2fq mas Q cns2fq [-Q minMapQ] [-n minNeiQ] [-d minProfundidade] [-D profundidade máxima] em.cns >
out.cns.fastq

Extraia as sequências de consenso no formato FASTQ. Nas linhas de sequência, bases
em minúsculas são essencialmente repetições ou não têm cobertura suficiente; bases
em maiúsculas indicam regiões onde os SNPs podem ser chamados com segurança. No
linhas de qualidade, ASCII de um caractere menos 33 dá a qualidade PHRED.

OPÇÕES:

-Q INT Qualidade mínima de mapeamento [40]

-d INT Profundidade mínima de leitura [3]

-n INT Qualidade mínima de vizinhança [20]

-D INT Dpeth máximo de leitura. > = 255 para ilimitado. [255]

cns2snp mas Q cns2snp em.cns > out.snp

Extraia sites SNP. Cada linha consiste em cromossomo, posição, base de referência,
base de consenso, qualidade de consenso semelhante a Phred, profundidade de leitura, o número médio de
ocorrências de leituras cobrindo esta posição, a mais alta qualidade de mapeamento das leituras
cobrindo a posição, o consenso mínimo de qualidade no flanqueamento de 3bp
regiões em cada lado do site (6pb no total), a segunda melhor chamada, log
razão de verossimilhança da segunda melhor e da terceira melhor escolha, e da terceira melhor
ligar.

A 5ª coluna é o critério principal ao julgar a confiabilidade de um SNP.
No entanto, como essa qualidade só é calculada assumindo a independência do local, você
também deve considerar outras colunas para obter chamadas SNP mais precisas. Roteiro
comando `maq.pl Filtro SNP'é projetado para isso (veja abaixo).

A 7ª coluna indica se o site cai em uma região repetitiva. Se não
ler cobrindo o site pode ser mapeado com alta qualidade de mapeamento, o flanqueamento
região é possivelmente repetitiva ou na falta de boas leituras. Um SNP em tal site
geralmente não é confiável.

A 8ª coluna fornece aproximadamente o número de cópias da região flanqueadora no
genoma de referência. Na maioria dos casos, esse número se aproxima de 1.00, o que significa que o
região é única. Às vezes, você pode ver uma profundidade de leitura diferente de zero, mas 0.00 em
a 7ª coluna. Isso indica que todas as leituras que cobrem a posição têm em
pelo menos duas incompatibilidades. Maq só conta o número de ocorrências de incompatibilidade 0 e 1 para
A referência. Isso se deve a um problema técnico complexo.

A 9ª coluna dá a qualidade vizinha. Filtrar nesta coluna também é
necessário para obter SNPs confiáveis. Esta ideia é inspirada no NQS, embora o NQS seja
inicialmente projetado para uma única leitura em vez de um consenso.

cns2view mas Q cns2view em.cns > out.view

Mostre informações detalhadas em todos os sites. O formato de saída é idêntico ao
cns2snp relatar.

cns2ref mas Q cns2ref em.cns > out.ref.fasta

Extraia a sequência de referência.

cns2win mas Q cns2win [-w Winsize] [-c chr] [-b começar] [-e final] [-q minQ] em.cns >
sair.ganhar

Extraia informações calculadas em uma janela de cultivo. A saída é delimitada por TAB,
que consiste no nome de referência, coordenada dividida por 1,000,000, taxa SNP,
taxa de het, profundidade de leitura bruta, profundidade de leitura em regiões aproximadamente únicas, o
número médio de acertos de leituras na janela e porcentagem de GC.

OPÇÕES:

-w INT Tamanho de uma janela [1000]

-c STR Sequência de referência destinada; caso contrário, todas as referências serão usadas
[nulo]

-b INT Posição inicial, 0 para nenhuma restrição [0]

-e INT Posição final, 0 para nenhuma restrição [0]

-q INT Qualidade consensual mínima dos sites a serem usados ​​[0]

Simulação Relacionado

Fakemut mas Q Fakemut [-r mutrar] [-R indelfrac] em.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Introduzir aleatoriamente substituições e indels na referência. Substituições e
Indels de pares de base simples podem ser adicionados.

OPÇÕES:

-r FLOAT Taxa de mutação [0.001]

-R FLOAT Fração de mutações a serem indels [0.1]

simutrain mas Q simutrain out.simupars.dat em.ler.fastq

Parâmetros de estimativa / trem para simulação de leitura.

simular mas Q simular [-d no tamanho] [-s desenvolvimento padrão] [-N nLê] [-1 readLen1] [-2 readLen2] [-r
taxa de mutação] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq em.ref.fasta
em.simupars.dat

Simule leituras finais emparelhadas. Arquivo em.simupars.dat determina os comprimentos de leitura e
distribuição de qualidade. É gerado a partir de simutrain, ou pode ser baixado de
Site da Maq. Nos arquivos de leitura de saída, um nome de leitura consiste na referência
nome da sequência e as coordenadas externas do par de leituras simuladas. Por
padrão simular assume que as leituras vêm de uma sequência diplóide que é gerada
adicionando dois conjuntos diferentes de mutações, incluindo um indels de par de base, para
em.ref.fasta.

OPÇÕES:

-d INT média da distância externa dos tamanhos de inserto [170]

-s INT desvio padrão dos tamanhos da pastilha [20]

-N INT número de pares de leituras a serem gerados [1000000]

-1 INT comprimento da primeira leitura [definido por em.simupars.dat]

-2 INT comprimento da segunda leitura [definido por em.simupars.dat]

-r FLOAT taxa de mutação [0.001]

-R FLOAT fração de indels de 1 bp [0.1]

-h adicionar todas as mutações a em.ref.fasta e gerar leituras do único
sequência mutada (modo haplóide)

NOTA:

* As leituras geradas a partir deste comando são independentes, o que se desvia do
verdade. Considerando que a avaliação de alinhamento é menos afetada por isso, a avaliação em
A chamada SNP deve ser realizada com cuidado. Dependência de erro pode ser uma das
as principais causas de chamadas SNP erradas.

simustat mas Q simustat in.simu-aln.map > out.simustat

Avalie as qualidades de mapeamento de leituras simuladas.

Sólido Relacionado

fasta2csfa mas Q fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

Converta o nucleotídeo FASTA em FASTA codificado por cores. Bandeira -c deve ser então aplicado
para mapa, comando. Na saída, a letra 'A' significa cor 0, 'C' significa 1, 'G'
para 2 e `T 'para 3. Cada sequência na saída é 1bp mais curta que a entrada.

csmap2nt mas Q csmap2nt out.nt.map in.ref.nt.bfa in.cs.map

Converta o alinhamento de cores em alinhamento de nucleotídeos. A entrada in.ref.nt.bfa é o
arquivo de referência FASTA binário de nucleotídeos. Deve corresponder ao arquivo original
a partir da qual a referência de cor é convertida. O consenso de nucleotídeos pode ser chamado
do alinhamento resultante.

Diversos / Avançado comandos

submapa mas Q submapa [-q minMapQ] [-Q maxSumErr] [-m máximoMM] [-p] out.map no.mapa

Filtrar alinhamentos ruins em no.mapa. As opções de linha de comando são descritas no
`montar'comando.

eland2maq mas Q eland2maq [-q desqualificar] out.map na lista em.eland

Converta o alinhamento do eland para o formato .map do maq. Arquivo na lista consiste na
nomes de sequência que aparecem na sétima coluna do arquivo de alinhamento eland
em.eland e o nome que você espera ver no alinhamento maq. O seguinte é um
exemplo:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Se você estiver alinhando leituras em vários lotes usando eland, é importante
use o mesmo na lista para a conversão. Além disso, o maq irá carregar todos os
alinhamentos e classificá-los na memória. Se você tiver concatenado vários eland
saídas em um arquivo enorme, você deve separá-lo em arquivos menores para
evita que o maq consuma toda a memória da máquina.

Na verdade, este comando tem como objetivo mostrar o alinhamento Eland em Maqview. Como nenhuma qualidade
informações estiverem disponíveis, o arquivo de alinhamento maq resultante não deve ser usado
para chamar genótipos de consenso.

exportar2maq mas Q exportar2maq [-1 read1len] [-2 read2len] [-a distância máxima] [-n] out.map na lista
em.exportação

Converta o formato de exportação da Illumina para o do Maq .mapa formato. O formato de exportação é um novo
formato de alinhamento desde SolexaPipeline-0.3.0 que também calcula o mapeamento
qualidades como maq. O arquivo resultante pode ser usado para chamar genótipos de consenso
já que a maioria das informações necessárias está disponível para que o maq faça isso com precisão.

OPÇÕES:

-1 INT Comprimento da primeira leitura [0]

-2 INT Comprimento da segunda leitura [0]

-a INT Distância externa máxima para um par de leitura correta [250]

-n Reter leituras filtradas

MAQ-PERL COMANDOS


demonstração maq.pl demonstração [-h] [-s] [-N nPares] [-d outDir] em.fasta in.simudat

Demonstrar o uso de mas Q e seus scripts complementares. Este comando irá
simular leituras de um arquivo FASTA em.fasta. O comprimento e as qualidades da sequência
são determinados por in.simudat que é gerado a partir de mas Q simutrain ou pode ser
baixado do site da Maq. As leituras simuladas serão então mapeadas com
maq.pl corrida fácil. A precisão do alinhamento é avaliada por mas Q simustat,
precisão de consenso por mas Q simulações, e a precisão SNP por maq_eval.pl.

Por padrão, as leituras finais emparelhadas serão simuladas e uma sequência diplóide será
gerado a partir da entrada adicionando mutações a qualquer tipo haplóide. A inserção
tamanho e taxa de mutação são controlados por mas Q simular.

OPÇÕES:

-h simular uma sequência haplóide em vez de uma sequência diplóide

-s use o modo single-end para alinhar as leituras em vez do modo pareado

-N INT número de pares de leituras a serem simuladas [1000000]

-d DIR diretório de saída [maqdemo]

NOTA:

* Os arquivos de saída de maq_eval.pl não foram documentados, mas você pode fazer
um bom palpite em alguns desses arquivos.

* Este comando apenas demonstra o uso do pacote maq. A precisão no real
os dados são quase sempre mais baixos do que o que você vê na simulação pura.

corrida fácil maq.pl corrida fácil [-1 ler1Len] [-d fora.dir] [-n nLê] [-A 3adaptador] [-e minDep]
[-q minCnsQ] [-p] [-2 ler2Len] [-a maxIns] [-S] [-N] em.ref.fasta in1.fastq
[in2.fastq]

Analisa o pipeline para pequenos genomas. O comando Easyrun irá executar a maioria das análises
implementado em mas Q. Por padrão, corrida fácil assume todas as sequências de leitura de entrada
os arquivos são de extremidade única e independentes; quando -p é especificado, duas sequências de leitura
são necessários arquivos, um para cada extremidade.

Vários arquivos serão gerados em fora.dir, entre os quais os seguintes arquivos são
o resultado principal:

cns.final.snp chamadas SNP finais com as de baixa qualidade filtradas

cns.fq sequências de consenso e qualidades no formato FASTQ

OPÇÕES:

-d DIR diretório de saída [easyrun]

-n INT número de leituras / pares em um lote de alinhamento [2000000]

-S aplicar análise de leitura dividida de indels curtos (talvez muito lento)

-N INT número de haplótipos / cepas no pool (> = 2) [2]

-A ARQUIVO arquivo para adaptador 3 '. O arquivo deve conter uma única linha de sequência
[nulo]

-1 INT comprimento da primeira leitura, 0 para auto [0]

-e INT profundidade de leitura mínima necessária para chamar um SNP (para SNPfilter) [3]

-q INT qualidade de consenso mínimo para SNPs em cns.final.snp [30]

-p mudar para o modo de alinhamento final emparelhado

-2 INT comprimento da segunda leitura quando -p é aplicado [0]

-a INT tamanho máximo de inserção quando -p é aplicado [250]

NOTAS:

* Para chamadas SNP em amostras agrupadas, os usuários devem definir `correto-N' assim como
`-E 0 '.

* O arquivo de entrada pode estar no formato binário do maq. maq.pl irá detectar automaticamente
o formato do arquivo.

Filtro SNP maq.pl Filtro SNP [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f em.indelsoa] [-s MinScore] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] em.cns2snp.snp >
out.filtrado.snp

Exclui SNPs que são cobertos por poucas leituras (especificado por -d), por muitos
lê (especificado por -D), próximo (especificado por -w) para um potencial indel, caindo
em uma possível região repetitiva (caracterizada por -Q), ou de baixa qualidade
bases vizinhas (especificadas por -n). Se maxWinSNP ou mais SNPs aparecem em qualquer
densWinSize janela, eles também serão filtrados juntos.

OPÇÕES:

-d INT Profundidade de leitura mínima necessária para chamar um SNP [3]

-D INT Profundidade máxima de leitura necessária para chamar um SNP (<255, caso contrário, ignorado)
[256]

-Q INT Qualidade máxima de mapeamento exigida de leituras cobrindo o SNP [40]

-q INT Qualidade de consenso mínimo [20]

-n INT Qualidade mínima de consenso adjacente [20]

-w INT Tamanho da janela em torno dos indels potenciais. SNPs que estão próximos
aos indels serão suprimidos [3]

-F ARQUIVO A indelé saída [nula]

-f ARQUIVO A Indelsoa saída [nula]

-s INT Pontuação mínima para um soa-indel a ser considerado [3]

-m INT Número máximo de leituras que podem ser mapeadas em um soa-indel [1]

-a Filtro alternativo para alinhamento de extremidade única

indelé maq.pl indelé in.indelpe > out.indelpe

Corrija o número de leituras mapeadas sem indels para tratos de homopolímero. Esse
comando modificar a 4ª, 10ª e as últimas três colunas de in.indelpe e
produzir o resultado em out.indelpe. Após a correção, o seguinte awk
comando dá indels homozigotos putativos:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && ($ 6 + $ 7) / $ 4> = 0.75'

e o seguinte fornece heterozigotos:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && ($ 6 + $ 7) / $ 4 <0.75'

Por favor note que este indelé comando apenas implementa várias regras heurísticas.
Não corrige para execuções de homopolímero impuro ou di-nucleotídeo / tripleto
repete. Consequentemente, os dois comandos awk fornecem apenas hom / het aproximado
indeles.

EXEMPLOS


· Script Easyrun:
maq.pl easyrun -d easyrun ref.fasta parte1.fastq parte2.fastq

· Principais comandos por trás do easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq parte1.fastq parte1.bfq;
maq fastq2bfq parte2.fastq parte2.bfq;
mapa maq part1.map ref.bfa part1.bfq;
mapa maq part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq montar cns.cns ref.bfa aln.map;

Use maq online usando serviços onworks.net


Servidores e estações de trabalho gratuitos

Baixar aplicativos Windows e Linux

  • 1
    traço
    traço
    O projeto strace foi movido para
    https://strace.io. strace is a
    diagnóstico, depuração e instrução
    rastreador de espaço do usuário para Linux. É usado
    para monitorar um...
    Baixar strace
  • 2
    gMKVEExtractGUI
    gMKVEExtractGUI
    Uma GUI para o utilitário mkvextract (parte do
    MKVToolNix) que incorpora a maioria (se
    nem todas) funcionalidade de mkvextract e
    utilitários mkvinfo. Escrito em C#NET 4.0,...
    Baixar gMKVExtractGUI
  • 3
    Biblioteca JasperReports
    Biblioteca JasperReports
    A biblioteca JasperReports é a
    código aberto mais popular do mundo
    inteligência de negócios e relatórios
    motor. É inteiramente escrito em Java
    e é capaz de ...
    Baixe a Biblioteca JasperReports
  • 4
    Livros Frappe
    Livros Frappe
    Frappe Books é um software livre e de código aberto
    software de contabilidade de desktop que é
    simples e bem projetado para ser usado por
    pequenas empresas e freelancers. Isto'...
    Baixar Livros Frappé
  • 5
    Python Numérica
    Python Numérica
    NOTÍCIAS: NumPy 1.11.2 é a última versão
    que será feito no sourceforge. Rodas
    para Windows, Mac e Linux, bem como
    distribuições de fonte arquivadas podem ser ...
    Baixar Numérico Python
  • 6
    Esfinge CMU
    Esfinge CMU
    CMUSphinx é um alto-falante independente grande
    vocabulário reconhecedor de fala contínuo
    lançado sob licença de estilo BSD. Isso é
    também uma coleção de ferramentas de código aberto ...
    Baixar CMU Sphinx
  • Mais "

Comandos Linux

Ad