EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

ipdSummary - Online în cloud

Rulați ipdSummary în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda ipdSummary care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


ipdSummary - Detectează modificările bazei ADN din semnăturile cinetice.

DESCRIERE


kineticsTool încarcă IPD-urile observate la fiecare poziție din genom și compară acele IPD-uri
la valoarea așteptată pentru ADN-ul nemodificat și emite rezultatul acestui test statistic.
Valoarea așteptată IPD pentru ADN-ul nemodificat poate proveni fie de la an in Silicon Control sau un
amplificat Control. Controlul in silico este antrenat de PacBio și livrat cu
pachet. Acesta prezice prezice IPD folosind contextul secvenței locale în jurul curentului
poziţie. Un set de date de control amplificat este generat prin secvențierea ADN-ului nemodificat cu
aceeași secvență ca și proba de testare. O probă de control amplificată este de obicei generată de
amplificarea întregului genom a probei originale.

Modificare Detectare
Modul de bază al kineticsTools face o comparație independentă a IPD-urilor la fiecare poziție de pe
genomul, pentru fiecare catenă, și emite diverse statistici către CSV și GFF (după aplicarea unui
filtru de semnificație).

modificările aduse Identificare
Kinetics Tools de asemenea are a Modificare Identificare mod acea poate să decodifica multi-site IPD
„amprentele digitale” în a redus set of Apeluri of specific modificări. Acest trăsătură are il
următor beneficii:

· Se pot distinge modificări diferite care au loc pe aceeași bază (pentru
exemplu m5C și m4C)

· Semnalul dintr-o modificare este combinat într-o singură statistică, îmbunătățindu-se
sensibilitate, eliminarea vârfurilor suplimentare și centrarea corectă a apelului

OPŢIUNI


Vă rugăm să sunați la acest program cu --Ajutor pentru a vedea opțiunile disponibile.

ALGORITM


Sintetic Mod de control
Studiile privind relația dintre IPD și contextul secvenței arată că majoritatea
variația IPD medie într-un genom poate fi prezisă dintr-un context de secvență de 12 baze
înconjoară locul activ al ADN polimerazei. Limitele contextului relevant
fereastra corespund ferestrei ADN-ului în contact cu polimeraza, așa cum se vede în
Structuri cristaline ADN/polimerază. Pentru a simplifica procesul de găsire a modificărilor ADN
cu datele PacBio, instrumentul include un tabel de căutare pre-antrenat care cartografiază ADN-ul 12-mer
secvențe pentru a însemna IPD observate în chimia C2.

Filtrare și firet
kineticsTools folosește Mapping QV generat de BLASR și stocat în fișierul cmp.h5 pentru a
ignorați citirile care nu sunt mapate cu încredere. Valoarea minimă implicită de cartografiere QV necesară este
10, implicând că BLSR are 90\% încredere că citirea este corect mapată. Din cauza
intervalul de lungimi de citire inerente datelor PacBioAcest lucru poate fi modificat prin utilizarea
--mapQvThreshold argument din linia de comandă sau prin dialogul de configurare SMRTPortal pentru
Detectarea modificărilor.

Există câteva caracteristici ale datelor PacBio care necesită o atenție specială pentru a le atinge
performanță bună de detectare a modificărilor. kineticsTools inspectează alinierea dintre
bazele observate și secvența de referință -- pentru ca o măsurătoare IPD să fie
inclusă în analiză, secvența de citire PacBio trebuie să se potrivească cu secvența de referință pentru k
în jurul bazei înrudite. În modulul actual k = 1 Distribuția IPD la un anumit loc să fie
gândit ca un amestec între procesul de încorporare „normal” IPD, care este sensibil
la contextul secvenței locale și modificările ADN și un proces de „pauză” contaminant
IPD care au o durată mult mai lungă (în medie > 10 ori mai lungă decât în ​​mod normal), dar se întâmplă rar
(~1% din IPD). Notă: înțelegerea noastră actuală este că pauzele nu sunt utile
informații despre starea de metilare a ADN-ului, oricum ar fi o analiză mai atentă
garantat. De asemenea, rețineți că modificările care cresc drastic Aproximativ 1% din
IPD-urile observate sunt generate de evenimente de pauză. Limitarea IPD-urilor observate la 99-lea global
percentila este motivată de teorie din testarea robustă a ipotezelor. Unele contexte secvențe
poate avea IPD-uri în mod natural mai lungi, pentru a evita limitarea prea multor date în acele contexte, limita
pragul este ajustat în funcție de context, după cum urmează: capThreshold = max(global99,
5*modelPrediction, percentil(ipdObservations, 75))

Statistic Testarea
Testăm ipoteza că IPD-urile observate la un anumit loc din eșantion au a
medii mai lungi decât IPD-urile observate la același locus în ADN-ul nemodificat. Dacă am generat
un set de date cu amplificare a genomului întreg, care elimină modificările ADN, folosim un caz-control,
test t cu două probe. Acest instrument oferă, de asemenea, un model de „control sintetic” pre-calibrat
care prezice IPD nemodificat, având în vedere un context de secvență de 12 baze. În sintetic
caz de control, folosim un test t cu un eșantion, cu o ajustare pentru a ține cont de eroarea în
model de control sintetic.

INTRĂRI


aligned_reads.cmp.h5
Un fișier standard cmp.h5 conține aliniamente, iar informațiile IPD furnizează datele cinetice
utilizat pentru a efectua detectarea modificărilor. Fișierul standard cmp.h5 al unui job SMRTportal este
data/aligned_read.cmp.h5.

Referinţă Secvenţă
Instrumentul necesită secvența de referință utilizată pentru a efectua aliniamente. În prezent acest lucru trebuie
să fie furnizate prin calea către o intrare din depozitul de referință SMRTportal.

IESIRI


Instrumentul de detectare a modificărilor oferă rezultate într-o varietate de formate potrivite pentru
analiză statistică aprofundată, referință rapidă și consum prin instrumente de vizualizare
cum ar fi PacBio SMRTView. Rezultatele sunt în general indexate după poziţia de referinţă şi
catenă de referință. În toate cazurile, valoarea firului se referă la firul care poartă
modificarea probei de ADN. Amintiți-vă că efectul cinetic al modificării este
observat în secvențele citite aliniate la catena opusă. Deci citește alinierea la
componenta pozitivă poartă informații despre modificarea pe componenta negativă și vice
invers, dar în acest set de instrumente raportăm întotdeauna firul care conține putativul
modificare.

modificări.csv
Fișierul modifications.csv conține câte un rând pentru fiecare pereche (poziție de referință, fir).
care au apărut în setul de date cu acoperire de cel puțin x. x este implicit 3, dar este
configurabil cu indicatorul „--minCoverage” la ipdSummary.py. Indicele poziţiei de referinţă este
Bazat pe 1 pentru compatibilitate cu fișierul gff mediul R.

producție coloane
in Silicon Control mod

┌────────────────┬──────────────────────────────── ──┐
│Coloană │ Descriere │
├────────────────┼──────────────────────────────── ──┤
│refId │ ID secvență de referință a acestui │
│ │ observație │
├────────────────┼──────────────────────────────── ──┤
│tpl │ Poziția șablonului bazată pe 1 │
├────────────────┼──────────────────────────────── ──┤
│filă │ catenă eșantion nativă unde │
│ │ cinetica au fost generate. „0” este │
│ │ firul originalului │
│ │ FASTA, „1” este catenul opus │
│ │ de la FASTA │
├────────────────┼──────────────────────────────── ──┤
│bază │ baza înrudită la acest │
│ │ poziție în referința │
├────────────────┼──────────────────────────────── ──┤
│scor │ Valoarea p transformată cu Phred care a │
│ │ abaterea cinetică există la acest │
│ │ poziție │
└────────────────┴──────────────────────────────── ──┘

│tMean │ media plafonată a IPD-urilor normalizate │
│ │ observat în această poziție │
├────────────────┼──────────────────────────────── ──┤
│tErr │ eroare standard plafonată de │
│ │ IPD normalizate observate la acest │
│ │ poziție (abatere standard / │
│ │ sqrt(acoperire) │
├────────────────┼──────────────────────────────── ──┤
│modelPrediction │ IPD medie normalizată prezis de │
│ │ modelul de control sintetic pentru │
│ │ acest context de secvență │
├────────────────┼──────────────────────────────── ──┤
│ipdRatio │ tMean / modelPrediction │
├────────────────┼──────────────────────────────── ──┤
│acoperire │ număr de IPD valide la acest │
│ │ poziție (vezi secțiunea Filtrare │
│ │ pentru detalii) │
├────────────────┼──────────────────────────────── ──┤
│frac │ estimarea fracției de │
│ │ molecule care poartă │
│ │ modificare │
├────────────────┼──────────────────────────────── ──┤
│fracLow │ 2.5% limită de încredere a frac │
│ │ estimare │
├────────────────┼──────────────────────────────── ──┤
│fracUpp │ 97.5% limită de încredere a frac │
│ │ estimare │
└────────────────┴──────────────────────────────── ──┘

caz-control mod

┌────────────────┬──────────────────────────────── ──┐
│Coloană │ Descriere │
├────────────────┼──────────────────────────────── ──┤
│refId │ ID secvență de referință a acestui │
│ │ observație │
├────────────────┼──────────────────────────────── ──┤
│tpl │ Poziția șablonului bazată pe 1 │
├────────────────┼──────────────────────────────── ──┤
│filă │ catenă eșantion nativă unde │
│ │ cinetica au fost generate. „0” este │
│ │ firul originalului │
│ │ FASTA, „1” este catenul opus │
│ │ de la FASTA │
├────────────────┼──────────────────────────────── ──┤
│bază │ baza înrudită la acest │
│ │ poziție în referința │
├────────────────┼──────────────────────────────── ──┤
│scor │ Valoarea p transformată cu Phred care a │
│ │ abaterea cinetică există la acest │
│ │ poziție │
├────────────────┼──────────────────────────────── ──┤
│caseMean │ media IPD de caz normalizat │
│ │ observat în această poziție │
├────────────────┼──────────────────────────────── ──┤
│controlMean │ media IPD-urilor de control normalizate │
│ │ observat în această poziție │
├────────────────┼──────────────────────────────── ──┤
│caseStd │ abaterea standard a IPD-urilor de caz │
│ │ observat în această poziție │
├────────────────┼──────────────────────────────── ──┤
│controlStd │ abaterea standard a controlului │
│ │ IPD observate în această poziție │
└────────────────┴──────────────────────────────── ──┘

│ipdRatio │ tMean / modelPrediction │
├────────────────┼──────────────────────────────── ──┤
│testStatistic │ t-test statistic │
├────────────────┼──────────────────────────────── ──┤
│acoperire │ medie de caz și control │
│ │ acoperire │
├────────────────┼──────────────────────────────── ──┤
│controlCoverage │ numărul IPD-urilor de control valide la │
│ │ această poziție (consultați Filtrarea │
│ │ secțiune pentru detalii) │
├────────────────┼──────────────────────────────── ──┤
│caseCoverage │ numărul IPD-urilor de caz valide la acest │
│ │ poziție (vezi secțiunea Filtrare │
│ │ pentru detalii) │
└────────────────┴──────────────────────────────── ──┘

modificări.gff
Modifications.gff este compatibil cu specificația GFF Versiunea 3 (‐
http://www.sequenceontology.org/gff3.shtml). Fiecare poziție șablon / pereche de șuvițe a căror
valoarea p depășește pragul valorii p apare ca un rând. Poziția șablonului este bazată pe 1,
conform specificațiilor GFF. Coloana de șuvițe se referă la șuvița care poartă materialul detectat
modificare, care este partea opusă celor utilizate pentru a detecta modificarea. The
Coloana de încredere GFF este o valoare p de detecție transformată prin Phred.

notițe on genomului browser-ul compatibilitate

Fișierul modifications.gff nu va funcționa direct cu majoritatea browserelor pentru genom. Tu vei
probabil că trebuie să faceți o copie a fișierului GFF și să convertiți coloanele _seqid_ din fișierul
numele generice „ref0000x” generate de PacBio, la anteturile FASTA prezente în originalul
referință la fișierul FASTA. Tabelul de mapare este scris în antetul modificărilor.gff
fișier în #sequence-header Etichete. Această problemă va fi rezolvată în versiunea 1.4 a
Kinetics Tools.

Coloana de date auxiliare a fișierului GFF conține alte statistici care pot fi utile
analiza sau filtrarea în aval. În special nivelul de acoperire al citirilor obișnuite
efectuați apelul și +/- 20bp contextul secvenței care înconjoară site-ul.

┌───────────┬───────────────────────────────────
│Coloană │ Descriere │
├───────────┼────────────────────────────────────────
│seqid │ Fasta contig nume │
├───────────┼────────────────────────────────────────
│sursă │ Numele instrumentului -- 'kinModCall' │
├───────────┼────────────────────────────────────────
│tip │ Tip modificare -- în │
│ │ modul de identificare acesta va fi │
│ │ m6A, m4C sau m5C pentru │ identificate
│ │ baze, sau eticheta generică │
│ │ 'bază_modificată' dacă o cinetică │
│ │ a fost detectat un eveniment care nu │
│ │ se potrivesc cu o modificare cunoscută │
│ │ semnătură │
├───────────┼────────────────────────────────────────
│start │ Poziție de modificare pe contig │
├───────────┼────────────────────────────────────────
│end │ Poziție de modificare pe contig │
├───────────┼────────────────────────────────────────
│scor │ Valoarea p transformată Phred a │
│ │ detecție - aceasta este │
│ │ valoarea p de detecție unică │
├───────────┼────────────────────────────────────────
│torțină │ Șuviță probă care conține │
│ │ modificare │
└───────────┴──────────────────────────────────────────

│fază │ Nu se aplică │
├───────────┼────────────────────────────────────────
│atribute │ Câmpuri suplimentare relevante pentru bază │
│ │ mods. IPDRatio este tradițional │
│ │ IPDRatio, contextul este │
│ │ secvență de referință de la -20bp la │
│ │ +20pb în jurul modificării, │
│ │ iar nivelul de acoperire este numărul │
│ │ a observațiilor IPD utilizate după │
│ │ Mapping QV filtrare și │
│ │ filtrare de precizie. Dacă rândul │
│ │ rezultă dintr-un │ identificat
│ │ modificare includem și un │
│ │ eticheta de identificareQv cu │
│ │ din modificarea │
│ │ procedura de identificare. │
│ │ identificareaQv este │
│ │ probabilitate transformată phred de │
│ │ o identificare incorectă, pentru │
│ │ baze care au fost identificate ca │
│ │ având un │ particular
│ │ modificare. frac, fracLow, │
│ │ fracUp sunt │ estimate
│ │ fracție de molecule purtătoare │
│ │ modificarea, iar cele 5% │
│ │ intervalele de încredere ale │
│ │ estimare. │ metilat
│ │ estimarea fracției este un │
│ │ caracteristică la nivel beta și ar trebui să │
│ │ poate fi folosit numai pentru explorarea │
│ │ scopuri. │
└───────────┴──────────────────────────────────────────

motive.gff
Dacă instrumentul Motif Finder este rulat, acesta va genera motifs.gff, care este o versiune reprocesată
de modificări.gff cu următoarele modificări. Dacă o modificare detectată are loc pe a
motiv detectat de găsitorul de motive, modificarea este adnotată cu date despre motiv. Un
este adăugat atributul „motiv” care conține șirul de motive și este adăugat un atribut „id”.
care conține id-ul motivului, care este șirul motivului pentru motivele nepereche sau
„motifString1/motifString2” pentru motive pereche. Dacă există un motiv în genom,
dar nu a fost detectat în modifications.gff, se adaugă o intrare la motifs.gff, indicând
prezența acelui motiv și cinetica care a fost observată la acel loc.

motiv_summary.csv
Dacă instrumentul Motif Finder este rulat, motiv_summary.csv este generat, rezumând
motive descoperite de unealta. CSV conține un rând pe motiv detectat, cu
următoarele coloane

┌───────────────────┬───────────────────────────── ─────┐
│Coloană │ Descriere │
├───────────────────┼───────────────────────────── ─────┤
│MotifString │ Secvența de motive detectată │
├───────────────────┼───────────────────────────── ─────┤
│centerPos │ Poziția în motivul lui │
│ │ modificare (bazat pe 0) │
├───────────────────┼───────────────────────────── ─────┤
│fracție │ Fracție de instanțe ale acestui │
│ │ motiv cu modificarea QV deasupra │
│ │ pragul QV │
├───────────────────┼───────────────────────────── ─────┤
│nDetectat │ Numărul de instanțe ale acestui │
│ │ motiv cu prag peste │
└───────────────────┴───────────────────────────── ─────┘

│nGenomul │ Numărul de instanțe ale acestui │
│ │ motiv în secvența de referință │
├───────────────────┼───────────────────────────── ─────┤
│groupTag │ Un șir care identifică motivul │
│ │ grupare. Pentru motive pereche, aceasta │
│ │ este │
│ │ " / ", │
│ │ Pentru motivele nepereche, aceasta este egală cu │
│ │ motivString │
├───────────────────┼───────────────────────────── ─────┤
│partnerMotifString │ motiv șir de motiv împerecheat │
│ │ (motiv cu │
│ │ invers-complementare │
│ │ motivString) │
├───────────────────┼───────────────────────────── ─────┤
│Scor mediu │ Modificarea medie Qv a detectat │
│ │ instanțe │
├───────────────────┼───────────────────────────── ─────┤
│meanIpdRatio │ Raportul IPD mediu al │ detectat
│ │ instanțe │
├───────────────────┼───────────────────────────── ─────┤
│MeanCoverage │ Acoperire medie a │ detectat
│ │ instanțe │
├───────────────────┼───────────────────────────── ─────┤
│objectiveScore │ Scorul obiectiv al acestui motiv în │
│ │ algoritmul de căutare a motivelor │
└───────────────────┴───────────────────────────── ─────┘

Utilizați ipdSummary online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

  • 1
    OfficeFloor
    OfficeFloor
    OfficeFloor oferă inversarea
    controlul cuplajului, cu: - dependenta
    injectare - continuare injectare -
    injecție filet Pentru mai multe informații
    Viziteaza...
    Descărcați OfficeFloor
  • 2
    DivKit
    DivKit
    DivKit este o sursă deschisă bazată pe server
    cadru UI (SDUI). Îți permite
    lansați actualizările provenite de la server la
    diferite versiuni de aplicație. De asemenea, poate fi
    folosit pentru ...
    Descărcați DivKit
  • 3
    subconvertor
    subconvertor
    Utilitate pentru a converti între diverse
    format de abonament. Utilizatori Shadowrocket
    ar trebui să folosească ss, ssr sau v2ray ca țintă.
    Puteți adăuga &remark= la
    HT apreciat de Telegram...
    Descărcați subconvertorul
  • 4
    SPĂLARE
    SPĂLARE
    SWASH este o valoare numerică de uz general
    instrument pentru simularea instabilității,
    nehidrostatic, cu suprafață liberă,
    flux rotaţional şi fenomene de transport
    în apele de coastă ca...
    Descărcați SWASH
  • 5
    VBA-M (arhivat - Acum pe Github)
    VBA-M (arhivat - Acum pe Github)
    Proiectul s-a mutat la
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Caracteristici:Creații de înșelăciune salvează stări multiple
    sistem, acceptă gba, gbc, gb, sgb,
    sgb2Tu...
    Descărcați VBA-M (arhivat - Acum pe Github)
  • 6
    Stacer
    Stacer
    Optimizator și monitorizare de sistem Linux
    Depozitul Github:
    https://github.com/oguzhaninan/Stacer.
    Public: utilizatori finali/desktop. Utilizator
    interfață: Qt. Programare La...
    Descărcați Stacer
  • Mai mult »

Comenzi Linux

Ad