InglêsFrancêsEspanhol

Ad


favicon do OnWorks

ipdSummary - Online na nuvem

Execute ipdSummary no provedor de hospedagem gratuita OnWorks no Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

Este é o comando ipdSummary que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

PROGRAMA:

NOME


ipdSummary - Detecta modificações de bases de DNA a partir de assinaturas cinéticas.

DESCRIÇÃO


kineticsTool carrega IPDs observados em cada posição no genoma e compara esses IPDs
para o valor esperado para DNA não modificado e produz o resultado deste teste estatístico.
O valor de IPD esperado para DNA não modificado pode vir de um em sílico ao controle ou um
amplificado ao controle. O controle in silico é treinado pela PacBio e enviado com o
pacote. Ele prevê o IPD usando o contexto de sequência local em torno do atual
posição. Um conjunto de dados de controle amplificado é gerado pelo sequenciamento de DNA não modificado com o
mesma sequência da amostra de teste. Uma amostra de controle amplificada é geralmente gerada por
amplificação de todo o genoma da amostra original.

Modificação Detecção
O modo básico do kineticsTools faz uma comparação independente de IPDs em cada posição no
o genoma, para cada fita, e emite várias estatísticas para CSV e GFF (após a aplicação de um
filtro de significância).

modificações identificação
ferramentas de cinética tb tem a Modificação identificação modo que pode decodificar vários sites IPD
'impressões digitais' para dentro a reduzido conjunto of chamadas of específico modificações. Esta integrado tem que o
seguinte benefícios:

· Diferentes modificações que ocorrem na mesma base podem ser distinguidas (para
exemplo m5C e m4C)

· O sinal de uma modificação é combinado em uma estatística, melhorando
sensibilidade, removendo picos extras e centralizando corretamente a chamada

OPÇÕES


Ligue para este programa com --Socorro para ver as opções disponíveis.

ALGORITMO


Sintético Control
Estudos da relação entre IPD e contexto de sequência revelam que a maioria dos
variação na IPD média em um genoma pode ser prevista a partir de um contexto de sequência de 12 bases
em torno do sítio ativo da DNA polimerase. Os limites do contexto relevante
janela corresponde à janela do DNA em contato com a polimerase, como visto em
Estruturas de cristal de DNA / polimerase. Para simplificar o processo de localização de modificações de DNA
com os dados do PacBio, a ferramenta inclui uma tabela de pesquisa pré-treinada que mapeia o DNA de 12 mer
sequências para significar IPDs observados na química C2.

Filtragem e aparar
kineticsTools usa o mapeamento QV gerado pelo BLASR e armazenado no arquivo cmp.h5 para
ignorar leituras que não são mapeadas com segurança. O QV de mapeamento mínimo padrão necessário é
10, implicando que BLASR tem 90 \% confiança de que a leitura está mapeada corretamente. Por causa de
a faixa de comprimentos de leitura inerentes aos dados do PacBio. Isso pode ser alterado usando o
- argumento da linha de comando do mapaQvThreshold ou através da caixa de diálogo de configuração SMRTPortal para
Detecção de modificação.

Existem alguns recursos dos dados do PacBio que requerem atenção especial a fim de alcançar
bom desempenho de detecção de modificação. kineticsTools inspeciona o alinhamento entre o
bases observadas e a sequência de referência - para que uma medição IPD seja
incluída na análise, a sequência de leitura do PacBio deve corresponder à sequência de referência para k
em torno da base cognata. No módulo atual k = 1 A distribuição IPD em algum local seja
pensado como uma mistura entre o processo de incorporação 'normal' IPD, que é sensível
para o contexto de sequência local e modificações de DNA e um processo de 'pausa' contaminante
IPD que tem uma duração muito mais longa (média> 10x mais do que o normal), mas acontecem raramente
(~ 1% dos IPDs). Nota: Nosso entendimento atual é que as pausas não são úteis
informações sobre o estado de metilação do DNA, no entanto, uma análise mais cuidadosa pode ser
garantido. Observe também que as modificações que aumentam drasticamente a cerca de 1% de
IPDs observados são gerados por eventos de pausa. Limitando IPDs observados no 99º global
o percentil é motivado pela teoria a partir de testes de hipóteses robustas. Alguns contextos de sequência
pode ter IPDs naturalmente mais longos, para evitar limitar muitos dados nesses contextos, o limite
o limite é ajustado por contexto da seguinte forma: capThreshold = max (global99,
5 * modelPrediction, percentil (ipdObservations, 75))

Estatístico ensaio
Testamos a hipótese de que IPDs observados em um locus particular na amostra têm um
significa mais tempo do que os IPDs observados no mesmo locus no DNA não modificado. Se tivermos gerado
um conjunto de dados amplificado do genoma inteiro, que remove as modificações do DNA, usamos um caso-controle,
teste t de duas amostras. Esta ferramenta também fornece um modelo de 'controle sintético' pré-calibrado
que prevê o IPD não modificado, dado um contexto de sequência de 12 bases. No sintético
caso de controle, usamos um teste t de uma amostra, com um ajuste para contabilizar o erro no
modelo de controle sintético.

ENTRADAS


alinhado_reads.cmp.h5
Um arquivo cmp.h5 padrão contém alinhamentos e as informações IPD fornecem os dados cinéticos
usado para realizar a detecção de modificação. O arquivo cmp.h5 padrão de trabalhos SMRTportal é
data / align_read.cmp.h5.

Referência Seqüência
A ferramenta requer a sequência de referência usada para realizar os alinhamentos. Atualmente isso deve
ser fornecido por meio do caminho para uma entrada do repositório de referência SMRTportal.

SAÍDAS


A ferramenta de detecção de modificação fornece resultados em uma variedade de formatos adequados para
análise estatística aprofundada, referência rápida e consumo por ferramentas de visualização
como PacBio SMRTView. Os resultados são geralmente indexados por posição de referência e
fita de referência. Em todos os casos, o valor do fio refere-se ao fio que carrega o
modificação na amostra de DNA. Lembre-se de que o efeito cinético da modificação é
observado em sequências de leitura alinhadas à fita oposta. Portanto, lê o alinhamento com o
fita positiva carrega informações sobre modificação na fita negativa e vice
vice-versa, mas neste kit de ferramentas sempre relatamos a vertente contendo o putativo
modificação.

modificações.csv
O arquivo modify.csv contém uma linha para cada par (posição de referência, fio)
que apareceu no conjunto de dados com cobertura de pelo menos x. x padrão é 3, mas é
configurável com o sinalizador '--minCoverage' para ipdSummary.py. O índice de posição de referência é
Baseado em 1 para compatibilidade com o arquivo gff do ambiente R.

saída colunas
em sílico ao controle modo

┌──────────────────┬────────────────────────────────────────────────────┬─────────────────────────────── ──┐
│Coluna │ Descrição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│refId │ ID de sequência de referência deste │
│ │ observação │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│tpl │ Posição do modelo baseado em 1 │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│strand │ strand de amostra nativa onde │
│ │ cinética foram geradas. '0' é │
│ │ o fio do original │
│ │ FASTA, '1' é a fita oposta │
│ │ do FASTA │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│base │ a base cognata neste │
│ │ posição na referência │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│core │ pvalor transformado por Phred que a │
│ │ desvio cinético existe neste │
│ │ posição │
└──────────────────┴────────────────────────────────────────────────────┴─────────────────────────────── ──┘

│tMédia │ média limitada de IPDs normalizados │
│ │ observado nesta posição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│tErr │ erro padrão limitado de │
│ │ IPDs normalizados observados neste │
│ │ posição (desvio padrão / │
│ │ sqrt (cobertura) │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│modelPrediction │ IPD médio normalizado previsto por │
│ │ o modelo de controle sintético para │
│ │ este contexto de sequência │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│ipdRatio │ tMédia/modeloPredição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│cobertura │ contagem de IPDs válidos neste │
Posição │ │ (ver seção Filtragem │
│ │ para detalhes) │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│frac │ estimativa da fração de │
│ │ moléculas que carregam o │
│ │ modificação │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│fracBaixo │ limite de confiança de 2.5% de frac │
│ │ estimativa │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│fracUpp │ limite de confiança de 97.5% de frac │
│ │ estimativa │
└──────────────────┴────────────────────────────────────────────────────┴─────────────────────────────── ──┘

controle de caso modo

┌──────────────────┬────────────────────────────────────────────────────┬─────────────────────────────── ──┐
│Coluna │ Descrição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│refId │ ID de sequência de referência deste │
│ │ observação │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│tpl │ Posição do modelo baseado em 1 │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│strand │ strand de amostra nativa onde │
│ │ cinética foram geradas. '0' é │
│ │ o fio do original │
│ │ FASTA, '1' é a fita oposta │
│ │ do FASTA │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│base │ a base cognata neste │
│ │ posição na referência │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│core │ pvalor transformado por Phred que a │
│ │ desvio cinético existe neste │
│ │ posição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│caseMean │ média de casos normalizados IPDs │
│ │ observado nesta posição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│média de controle │ média de IPDs de controle normalizado │
│ │ observado nesta posição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│caseStd │ desvio padrão dos IPDs do caso │
│ │ observado nesta posição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│controlStd │ desvio padrão de controle │
│ │ IPDs observados nesta posição │
└──────────────────┴────────────────────────────────────────────────────┴─────────────────────────────── ──┘

│ipdRatio │ tMédia/modeloPredição │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│testStatistic │ estatística de teste t │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│cobertura │ média de caso e controle │
│ │ cobertura │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│controlCoverage │ contagem de IPDs de controle válidos em │
│ │ esta posição (ver Filtragem │
│ │ seção para detalhes) │
├──────────────────┼────────────────────────────────────────────────────┼─────────────────────────────── ──┤
│caseCoverage │ contagem de IPDs de casos válidos neste │
Posição │ │ (ver seção Filtragem │
│ │ para detalhes) │
└──────────────────┴────────────────────────────────────────────────────┴─────────────────────────────── ──┘

modificações.gff
Modificações.gff é compatível com a especificação GFF Versão 3 (-
http://www.sequenceontology.org/gff3.shtml) Cada posição do modelo / par de fios cujo
o valor p excede o limite pvalue aparece como uma linha. A posição do modelo é baseada em 1,
de acordo com a especificação GFF. A coluna da fita refere-se à fita que transporta o detectado
modificação, que é a fita oposta àquelas usadas para detectar a modificação. o
A coluna de confiança GFF é um valor p de detecção transformado por Phred.

Note on genoma navegador compatibilidade

O arquivo modify.gff não funcionará diretamente com a maioria dos navegadores genoma. Você irá
provavelmente será necessário fazer uma cópia do arquivo GFF e converter as colunas _seqid_ do
nomes genéricos 'ref0000x' gerados pelo PacBio, para os cabeçalhos FASTA presentes no original
arquivo FASTA de referência. A tabela de mapeamento é escrita no cabeçalho do changes.gff
arquivo em # sequência-cabeçalho Tag. Este problema será resolvido na versão 1.4 do
cinéticaFerramentas.

A coluna de dados auxiliares do arquivo GFF contém outras estatísticas que podem ser úteis
análise ou filtragem downstream. Em particular, o nível de cobertura das leituras usadas para
fazer a chamada e +/- contexto de sequência de 20 bp em torno do site.

┌──────────────┬────────────────────────────────────
│Coluna │ Descrição │
├──────────────┼────────────────────────────────────
│seqid │ Nome rápido contig │
├──────────────┼────────────────────────────────────
│source │ Nome da ferramenta - 'kinModCall' │
├──────────────┼────────────────────────────────────
│tipo │ Tipo de modificação - em │
│ │ modo de identificação este será │
│ │ m6A, m4C ou m5C para │ identificado
│ │ bases, ou a etiqueta genérica │
│ │ 'base modificada' se for cinética │
│ │ evento detectado que não │
│ │ corresponde a uma modificação conhecida │
│ │ assinatura │
├──────────────┼────────────────────────────────────
│início │ Posição de modificação no contig │
├──────────────┼────────────────────────────────────
│end │ Posição de modificação no contig │
├──────────────┼────────────────────────────────────
│core │ valor p transformado de Phred de │
│ │ detecção - este é o │
│ │ valor p de detecção de site único │
├──────────────┼────────────────────────────────────
│strand │ Amostra de fita contendo │
│ │ modificação │
└──────────────┴────────────────────────────────────

│ fase │ Não aplicável │
├──────────────┼────────────────────────────────────
│atributos │ Campos extras relevantes para a base │
│ │ mods. IPDRatio é tradicional │
│ │ IPDRatio, o contexto é o │
│ │ sequência de referência -20bp a │
│ │ + 20 bp em torno da modificação, │
│ │ e o nível de cobertura é o número │
│ │ das observações IPD usadas após │
│ │ Filtragem QV de mapeamento e │
│ │ filtragem de precisão. Se a linha │
│ │ resultados de um │ identificado
│ │ modificação, também incluímos um │
│ │ tag identificationQv com │
│ │ da modificação │
│ │ procedimento de identificação. │
│ │ identificationQv é │
│ │ probabilidade transformada por phred de │
│ │ uma identificação incorreta, para │
│ │ bases que foram identificadas como │
│ │ tendo um │ particular
│ │ modificação. frac, fracLow, │
│ │ fracUp são os estimados │
│ │ fração de moléculas que transportam │
│ │ a modificação, e os 5% │
│ │ intervalos de confiança de │
│ │ estimativa. O metilado │
│ │ a estimativa da fração é um │
│ │ recurso de nível beta, e deve │
│ │ ser usado apenas para fins exploratórios │
│ │ finalidades. │
└──────────────┴────────────────────────────────────

motivos.gff
Se a ferramenta Motif Finder for executada, ela irá gerar motifs.gff, que é uma versão reprocessada
de modificações.gff com as seguintes alterações. Se uma modificação detectada ocorrer em um
motivo detectado pelo localizador de motivo, a modificação é anotada com dados do motivo. Um
o atributo 'motif' é adicionado contendo a string do motivo, e um atributo 'id' é adicionado
contendo o motivo id, que é a sequência de motivos para motivos desemparelhados ou
'motifString1 / motifString2' para motivos emparelhados. Se uma instância de motivo existe no genoma,
mas não foi detectado em modificações.gff, uma entrada é adicionada a motifs.gff, indicando o
presença desse motivo e a cinética observada naquele local.

motivo_resumo.csv
Se a ferramenta Motif Finder for executada, motif_summary.csv é gerado, resumindo o
motivos descobertos pela ferramenta. O CSV contém uma linha por motivo detectado, com o
seguintes colunas

┌─────────────────────┬─────────────────────────────────────────────────────────── ─────┐
│Coluna │ Descrição │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│ MotifString │ Sequência de motivos detectada │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│centerPos │ Posição no motivo de │
│ │ modificação (base 0) │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│fração │ Fração de instâncias deste │
│ │ motivo com modificação QV acima │
│ │ o limite QV │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│nDetected │ Número de instâncias deste │
│ │ motivo com limite acima │
└─────────────────────┴───────────────────────────────────────────────────────────────────────────────────── ─────┘

│nGenome │ Número de instâncias deste │
│ │ motivo na sequência de referência │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│groupTag │ Uma string que identifica o motivo │
│ │ agrupamento. Para motivos emparelhados, este │
│ │ é │
│ │ " / ", │
│ │ Para motivos não pareados, isso é igual a │
│ │ motivoString │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│partnerMotifString │ motifString do motivo emparelhado │
│ │ (motivo com │
│ │ complementar-reverso │
│ │ motivoString) │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│meanScore │ Modificação média Qv de detectado │
│ │ instâncias │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│meanIpdRatio │ Proporção média de IPD detectada │
│ │ instâncias │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│meanCoverage │ Cobertura média detectada │
│ │ instâncias │
├─────────────────────┼───────────────────────────────────────────────────────────────────────────────────── ─────┤
│objectiveScore │ Pontuação objetiva deste motivo em │
│ │ o algoritmo do localizador de motivos │
└─────────────────────┴───────────────────────────────────────────────────────────────────────────────────── ─────┘

Use ipdSummary online usando serviços onworks.net


Servidores e estações de trabalho gratuitos

Baixar aplicativos Windows e Linux

  • 1
    Piso de escritório
    Piso de escritório
    OfficeFloor fornece inversão de
    controle de acoplamento, com sua: - dependência
    injeção - injeção de continuação -
    injeção de thread Para mais informações
    visite a...
    Baixar OfficeFloor
  • 2
    Kit Div
    Kit Div
    DivKit é um servidor de código aberto baseado em
    Estrutura de IU (SDUI). Ele permite que você
    distribuir atualizações provenientes do servidor para
    diferentes versões de aplicativos. Além disso, pode ser
    usado para ...
    Baixe o DivKit
  • 3
    subconversor
    subconversor
    Utilitário para converter entre vários
    formato de assinatura. Usuários do Shadowrocket
    deve usar ss, ssr ou v2ray como alvo.
    Você pode adicionar &remark= a
    HT curtido no Telegram...
    Baixar subconversor
  • 4
    SWASH
    SWASH
    SWASH é um numérico de uso geral
    ferramenta para simular instabilidade,
    não hidrostático, superfície livre,
    fluxo rotacional e fenômenos de transporte
    em águas costeiras como ...
    Baixar SWASH
  • 5
    VBA-M (arquivado - agora no Github)
    VBA-M (arquivado - agora no Github)
    O projeto mudou para
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Recursos: Criação de truques, salvar estados multi
    sistema, suporta gba, gbc, gb, sgb,
    sgb2Tu...
    Baixar VBA-M (arquivado - agora no Github)
  • 6
    Stacer
    Stacer
    Otimizador e monitoramento de sistema Linux
    Repositório Github:
    https://github.com/oguzhaninan/Stacer.
    Público: usuários finais / desktop. Do utilizador
    interface: Qt. Programação L...
    Baixar Stacer
  • Mais "

Comandos Linux

Ad