EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

ipdSummary – Online in der Cloud

Führen Sie ipdSummary beim kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl ipdSummary, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


ipdSummary – Erkennen Sie DNA-Basenmodifikationen anhand kinetischer Signaturen.

BESCHREIBUNG


kineticsTool lädt IPDs, die an jeder Position im Genom beobachtet wurden, und vergleicht diese IPDs
auf den für unmodifizierte DNA erwarteten Wert und gibt das Ergebnis dieses statistischen Tests aus.
Der erwartete IPD-Wert für unmodifizierte DNA kann von beiden stammen in-silico Smartgeräte App oder
verstärkt Smartgeräte App. Die In-Silico-Steuerung wird von PacBio trainiert und mit ausgeliefert
Paket. Es prognostiziert die IPD anhand des lokalen Sequenzkontexts um den aktuellen Wert
Position. Ein amplifizierter Kontrolldatensatz wird durch Sequenzierung unmodifizierter DNA mit dem generiert
Gleiche Reihenfolge wie bei der Testprobe. Eine verstärkte Kontrollprobe wird normalerweise durch erzeugt
Gesamtgenom-Amplifikation der Originalprobe.

Änderung Entdeckung
Der Grundmodus von kineticsTools führt einen unabhängigen Vergleich der IPDs an jeder Position durch
das Genom für jeden Strang und gibt verschiedene Statistiken an CSV und GFF aus (nach Anwendung von a
Signifikanzfilter).

Änderungen Login
KinetikTools ebenfalls hat a Änderung Login Modus zur Verbesserung der Gesundheitsgerechtigkeit kann dekodieren Multi-Site IPD
„Fingerabdrücke“ in a reduziert kompensieren of Anrufe of spezifisch Änderungen. Dieser -Funktion hat
Folgende Vorteile:

· Verschiedene Modifikationen, die auf derselben Basis auftreten, können unterschieden werden (z
Beispiel m5C und m4C)

· Das Signal einer Änderung wird in einer Statistik zusammengefasst und verbessert
Empfindlichkeit, Entfernen zusätzlicher Spitzen und korrektes Zentrieren des Anrufs

OPTIONAL


Bitte rufen Sie dieses Programm mit auf --help um die verfügbaren Optionen anzuzeigen.

ALGORITHM


Synthetik Control
Studien zur Beziehung zwischen IPD und Sequenzkontext zeigen, dass die meisten davon
Die Variation der mittleren IPD über ein Genom kann aus einem 12-Basen-Sequenzkontext vorhergesagt werden
umgibt das aktive Zentrum der DNA-Polymerase. Die Grenzen des relevanten Kontexts
Das Fenster entspricht dem Fenster der DNA in Kontakt mit der Polymerase, wie in gezeigt
DNA/Polymerase-Kristallstrukturen. Um das Auffinden von DNA-Modifikationen zu vereinfachen
Mit PacBio-Daten enthält das Tool eine vorab trainierte Nachschlagetabelle, die 12-mer-DNA abbildet
Sequenzen bedeuten IPDs, die in der C2-Chemie beobachtet werden.

Filterung und Beschneiden
kineticsTools verwendet das von BLASR generierte und in der Datei cmp.h5 gespeicherte Mapping QV
Ignorieren Sie Lesevorgänge, die nicht sicher zugeordnet sind. Der standardmäßig erforderliche Mindest-Mapping-QV beträgt
10, was bedeutet, dass BLASR dies getan hat 90\% Vertrauen, dass der Lesevorgang korrekt zugeordnet ist. Wegen
Der Bereich der Leselängen, die PacBio-Daten innewohnen. Dies kann mithilfe von geändert werden
--mapQvThreshold-Befehlszeilenargument oder über den SMRTPortal-Konfigurationsdialog für
Änderungserkennung.

Es gibt einige Funktionen von PacBio-Daten, die besondere Aufmerksamkeit erfordern, um sie zu erreichen
Gute Modifikationserkennungsleistung. kineticsTools prüft die Ausrichtung zwischen den
beobachteten Basen und der Referenzsequenz – damit eine IPD-Messung durchgeführt werden kann
Um in die Analyse einbezogen zu werden, muss die PacBio-Lesesequenz mit der Referenzsequenz für übereinstimmen k
um die entsprechende Basis. Im aktuellen Modul k = 1 Die IPD-Verteilung an einem bestimmten Ort sein
Man betrachtet es als eine Mischung aus dem „normalen“ Einarbeitungsprozess IPD, der empfindlich ist
auf den lokalen Sequenzkontext und DNA-Modifikationen und einen kontaminierenden „Pause“-Prozess zurückzuführen
IPD dauern viel länger (im Durchschnitt > 10x länger als normal), kommen aber selten vor
(~1 % der IPDs). Hinweis: Nach unserem derzeitigen Verständnis sind Pausen nicht sinnvoll
Informationen über den Methylierungszustand der DNA, wie auch immer eine sorgfältigere Analyse sein kann
garantiert. Beachten Sie auch, dass Modifikationen, die den Wert drastisch erhöhen, etwa 1 % betragen
beobachtete IPDs werden durch Pausenereignisse generiert. Begrenzung der beobachteten IPDs auf den globalen 99
Das Perzentil basiert auf der Theorie robuster Hypothesentests. Einige Sequenzkontexte
kann natürlich längere IPDs haben, um zu vermeiden, dass in diesen Kontexten zu viele Daten begrenzt werden, die Obergrenze
Der Schwellenwert wird pro Kontext wie folgt angepasst: capThreshold = max(global99,
5*Modellvorhersage, Perzentil(ipdObservations, 75))

Statistisch Testen
Wir testen die Hypothese, dass an einem bestimmten Ort in der Probe beobachtete IPDs eine haben
längere Mittel als IPDs, die am gleichen Ort in unmodifizierter DNA beobachtet wurden. Wenn wir generiert haben
einen Whole Genome Amplified-Datensatz, der DNA-Modifikationen entfernt, wir verwenden eine Fallkontrolle,
T-Test bei zwei Stichproben. Dieses Tool bietet auch ein vorkalibriertes „synthetisches Kontrollmodell“.
was die unveränderte IPD bei einem 12-Basen-Sequenzkontext vorhersagt. Im Synthetik
Im Kontrollfall verwenden wir einen t-Test bei einer Stichprobe mit einer Anpassung, um Fehler in der zu berücksichtigen
synthetisches Kontrollmodell.

EINGÄNGE


ausgerichtet_reads.cmp.h5
Eine Standarddatei cmp.h5 enthält Ausrichtungen und IPD-Informationen liefern die kinetischen Daten
Wird zur Änderungserkennung verwendet. Die Standarddatei cmp.h5 eines SMRTportal-Jobs ist
data/aligned_read.cmp.h5.

Referenz Reihenfolge
Das Tool benötigt die Referenzsequenz, die zum Durchführen von Ausrichtungen verwendet wird. Derzeit muss dies
über den Pfad zu einem SMRTportal-Referenz-Repository-Eintrag bereitgestellt werden.

OUTPUTS


Das Tool zur Änderungserkennung liefert Ergebnisse in einer Vielzahl geeigneter Formate
Detaillierte statistische Analyse, Schnellreferenz und Auswertung durch Visualisierungstools
wie PacBio SMRTView. Die Ergebnisse werden im Allgemeinen nach Referenzposition und indexiert
Referenzstrang. In allen Fällen bezieht sich der Strangwert auf den Strang, der das trägt
Modifikation in der DNA-Probe. Denken Sie daran, dass der kinetische Effekt der Modifikation ist
wird in Lesesequenzen beobachtet, die sich am gegenüberliegenden Strang ausrichten. Liest sich also im Einklang mit dem
Der positive Strang enthält Informationen über Änderungen am negativen Strang und umgekehrt
umgekehrt, aber in diesem Toolkit berichten wir immer über den Strang, der den mutmaßlichen Wert enthält
Modifikation.

Modifikationen.csv
Die Datei „modifikationen.csv“ enthält eine Zeile für jedes Paar (Referenzposition, Strang).
die im Datensatz mit einer Abdeckung von mindestens x vorkamen. x ist standardmäßig 3, ist es aber
konfigurierbar mit dem Flag „--minCoverage“ für ipdSummary.py. Der Referenzpositionsindex ist
1-basiert für Kompatibilität mit der GFF-Datei der R-Umgebung.

Output Spalten
in-silico Smartgeräte App Modus

┌────────────────┬──────────────────────────────── ──┐
│Spalte │ Beschreibung │
├────────────────┼──────────────────────────────── ──┤
│refId │ Referenzsequenz-ID davon │
│ │ Beobachtung │
├────────────────┼──────────────────────────────── ──┤
│tpl │ 1-basierte Vorlagenposition │
├────────────────┼──────────────────────────────── ──┤
│Strang │ nativer Probenstrang wobei │
│ │ Kinetik wurde erzeugt. '0' ist │
│ │ der Strang des Originals │
│ │ FASTA, '1' ist Gegenstrang │
│ │ von FASTA │
├────────────────┼──────────────────────────────── ──┤
│base │ die verwandte Basis an diesem │
│ │ Position in der Referenz │
├────────────────┼──────────────────────────────── ──┤
│Score │ Phred-transformierter p-Wert, der ein │ ist
│ │ Dabei liegt eine kinetische Abweichung vor │
│ │ Position │
└────────────────┴──────────────────────────────── ──┘

│tMean │ begrenzter Mittelwert normalisierter IPDs │
│ │ an dieser Position beobachtet │
├────────────────┼──────────────────────────────── ──┤
│tErr │ begrenzter Standardfehler von │
│ │ normalisierte IPDs, die dabei beobachtet wurden │
│ │ Position (Standardabweichung / │
│ │ sqrt(Abdeckung) │
├────────────────┼──────────────────────────────── ──┤
│modelPrediction │ normalisierte mittlere IPD, vorhergesagt von │
│ │ das synthetische Kontrollmodell für │
│ │ dieser Sequenzkontext │
├────────────────┼──────────────────────────────── ──┤
│ipdRatio │ tMean / modelPrediction │
├────────────────┼──────────────────────────────── ──┤
│Abdeckung │ Anzahl gültiger IPDs zu diesem Zeitpunkt │
│ │ Position (siehe Abschnitt „Filterung“ │).
│ │ für Details) │
├────────────────┼──────────────────────────────── ──┤
│frac │ Schätzung des Bruchteils von │
│ │ Moleküle, die das │ tragen
│ │ Modifikation │
├────────────────┼──────────────────────────────── ──┤
│fracLow │ 2.5 %-Konfidenzgrenze von frac │
│ │ Schätzung │
├────────────────┼──────────────────────────────── ──┤
│fracUpp │ 97.5 % Konfidenzgrenze von frac │
│ │ Schätzung │
└────────────────┴──────────────────────────────── ──┘

Fallkontrolle Modus

┌────────────────┬──────────────────────────────── ──┐
│Spalte │ Beschreibung │
├────────────────┼──────────────────────────────── ──┤
│refId │ Referenzsequenz-ID davon │
│ │ Beobachtung │
├────────────────┼──────────────────────────────── ──┤
│tpl │ 1-basierte Vorlagenposition │
├────────────────┼──────────────────────────────── ──┤
│Strang │ nativer Probenstrang wobei │
│ │ Kinetik wurde erzeugt. '0' ist │
│ │ der Strang des Originals │
│ │ FASTA, '1' ist Gegenstrang │
│ │ von FASTA │
├────────────────┼──────────────────────────────── ──┤
│base │ die verwandte Basis an diesem │
│ │ Position in der Referenz │
├────────────────┼──────────────────────────────── ──┤
│Score │ Phred-transformierter p-Wert, der ein │ ist
│ │ Dabei liegt eine kinetische Abweichung vor │
│ │ Position │
├────────────────┼──────────────────────────────── ──┤
│caseMean │ Mittelwert der normalisierten Fall-IPDs │
│ │ an dieser Position beobachtet │
├────────────────┼──────────────────────────────── ──┤
│controlMean │ Mittelwert der normalisierten Kontroll-IPDs │
│ │ an dieser Position beobachtet │
├────────────────┼──────────────────────────────── ──┤
│caseStd │ Standardabweichung der Fall-IPDs │
│ │ an dieser Position beobachtet │
├────────────────┼──────────────────────────────── ──┤
│controlStd │ Standardabweichung der Kontrolle │
│ │ An dieser Position beobachtete IPDs │
└────────────────┴──────────────────────────────── ──┘

│ipdRatio │ tMean / modelPrediction │
├────────────────┼──────────────────────────────── ──┤
│testStatistic │ t-Test-Statistik │
├────────────────┼──────────────────────────────── ──┤
│Abdeckung │ Mittelwert aus Fall und Kontrolle │
│ │ Abdeckung │
├────────────────┼──────────────────────────────── ──┤
│controlCoverage │ Anzahl der gültigen Kontroll-IPDs bei │
│ │ diese Position (siehe Filtern │
│ │ Abschnitt für Einzelheiten) │
├────────────────┼──────────────────────────────── ──┤
│caseCoverage │ Anzahl gültiger Fall-IPDs zu diesem Zeitpunkt │
│ │ Position (siehe Abschnitt „Filterung“ │).
│ │ für Details) │
└────────────────┴──────────────────────────────── ──┘

Modifikationen.gff
Die „modifikationen.gff“ entspricht der GFF Version 3-Spezifikation (‐
http://www.sequenceontology.org/gff3.shtml). Jedes Template-Positions-/Strangpaar dessen
Der p-Wert überschreitet den p-Wert-Schwellenwert und wird als Zeile angezeigt. Die Vorlagenposition ist 1-basiert,
gemäß der GFF-Spezifikation. Die Spalte „Strang“ bezieht sich auf den Strang, der das erkannte trägt
Modifikation, bei der es sich um den entgegengesetzten Strang zu denen handelt, die zum Nachweis der Modifikation verwendet werden. Der
Die GFF-Konfidenzspalte ist ein Phred-transformierter p-Wert der Erkennung.

Note on Genom Browser Kompatibilität

Die Datei „modifikationen.gff“ funktioniert mit den meisten Genombrowsern nicht direkt. Du wirst
Wahrscheinlich müssen Sie eine Kopie der GFF-Datei erstellen und die _seqid_-Spalten aus konvertieren
generische „ref0000x“-Namen, die von PacBio generiert wurden, zu den im Original vorhandenen FASTA-Headern
Referenz-FASTA-Datei. Die Mapping-Tabelle wird in den Header der changes.gff geschrieben
Datei in #sequence-header Stichworte. Dieses Problem wird in der Version 1.4 von behoben
KinetikTools.

Die Hilfsdatenspalte der GFF-Datei enthält weitere Statistiken, die nützlich sein können
nachgelagerte Analyse oder Filterung. Insbesondere der Abdeckungsgrad der Lesevorgänge ist gewohnt
Tätigen Sie den Anruf und +/- 20 bp Sequenzkontext rund um die Site.

┌─────────────────────────────────────────── ┐.
│Spalte │ Beschreibung │
├─────────────────────────────────────────── ┤.
│seqid │ Fasta contig name │
├─────────────────────────────────────────── ┤.
│Quelle │ Name des Tools – „kinModCall“ │
├─────────────────────────────────────────── ┤.
│Typ │ Änderungstyp -- in │
│ │ Identifikationsmodus ist dies │
│ │ m6A, m4C oder m5C für identifizierte │
│ │ Basen oder das generische Tag │
│ │ 'modified_base' wenn eine kinetische │
│ │ Es wurde ein Ereignis erkannt, das nicht │
│ │ einer bekannten Modifikation entsprechen │
│ │ Unterschrift │
├─────────────────────────────────────────── ┤.
│Start │ Änderungsposition auf Contig │
├─────────────────────────────────────────── ┤.
│Ende │ Änderungsposition am Contig │
├─────────────────────────────────────────── ┤.
│Score │ Phred-transformierter p-Wert von │
│ │ Erkennung – das ist die │
│ │ Single-Site-Erkennung p-Wert │
├─────────────────────────────────────────── ┤.
│Strang │ Musterstrang mit │
│ │ Modifikation │
└─────────────────────────────────────────── ┘.

│Phase │ Nicht anwendbar │
├─────────────────────────────────────────── ┤.
│Attribute │ Zusätzliche, für die Basis relevante Felder │
│ │ Mods. IPDRatio ist traditionell │
│ │ IPDRatio, Kontext ist das │
│ │ Referenzsequenz -20bp bis │
│ │ +20 Basispunkte um die Modifikation herum, │
│ │ und der Abdeckungsgrad ist die Zahl │
│ │ der nach │ verwendeten IPD-Beobachtungen
│ │ Mapping QV-Filterung und │
│ │ Genauigkeitsfilterung. Wenn die Zeile │
│ │ resultiert aus einem identifizierten │
│ │ Modifikation fügen wir auch ein │ hinzu
│ │ IdentifikationQv-Tag mit dem │
│ │ aus der Modifikation │
│ │ Identifizierungsverfahren. │
│ │ IdentifikationQv ist das │
│ │ Phred-transformierte Wahrscheinlichkeit von │
│ │ eine falsche Identifikation, für │
│ │ Basen, die als │ identifiziert wurden
│ │ mit einem bestimmten │
│ │ Modifikation. frac, fracLow, │
│ │ fracUp sind die geschätzten │
│ │ Anteil der Moleküle, die │ tragen
│ │ die Änderung und die 5 % │
│ │ Konfidenzintervalle der │
│ │ Schätzung. Das methylierte │
│ │ Bruchschätzung ist ein │
│ │ Beta-Level-Funktion und sollte │
│ │ darf nur zur Erkundung verwendet werden │
│ │ Zwecke. │
└─────────────────────────────────────────── ┘.

Motive.gff
Wenn das Motif Finder-Tool ausgeführt wird, wird die Datei „motives.gff“ generiert, eine erneut verarbeitete Version
von changes.gff mit den folgenden Änderungen. Wenn eine erkannte Änderung an einem auftritt
Wird das Motiv vom Motivfinder erkannt, wird die Änderung mit Motivdaten annotiert. Ein
Es wird das Attribut „motif“ hinzugefügt, das die Motivzeichenfolge enthält, und ein Attribut „id“ wird hinzugefügt
enthält die Motiv-ID, die die Motivzeichenfolge für ungepaarte Motive darstellt oder
'motifString1/motifString2' für gepaarte Motive. Wenn eine Motivinstanz im Genom existiert,
aber in der Datei „modifications.gff“ nicht erkannt wurde, wird der Datei „motives.gff“ ein Eintrag hinzugefügt, der darauf hinweist
Vorhandensein dieses Motivs und die an dieser Stelle beobachtete Kinetik.

Motiv_Zusammenfassung.csv
Wenn das Tool „Motif Finder“ ausgeführt wird, wird „motive_summary.csv“ generiert, das die Änderungen zusammenfasst
vom Tool entdeckte Motive. Die CSV enthält eine Zeile pro erkanntem Motiv, mit dem
folgenden Spalten

┌───────────────────┬───────────────────────────── ─────┐
│Spalte │ Beschreibung │
├───────────────────┼───────────────────────────── ─────┤
│motifString │ Erkannte Motivsequenz │
├───────────────────┼───────────────────────────── ─────┤
│centerPos │ Position im Motiv von │
│ │ Modifikation (0-basiert) │
├───────────────────┼───────────────────────────── ─────┤
│Fraktion │ Bruchteil der Instanzen davon │
│ │ Motiv mit Modifikation QV oben │
│ │ die QV-Schwelle │
├───────────────────┼───────────────────────────── ─────┤
│nErkannt │ Anzahl der Instanzen davon │
│ │ Motiv mit oberhalb der Schwelle │
└───────────────────┴───────────────────────────── ─────┘

│nGenom │ Anzahl der Instanzen davon │
│ │ Motiv in Referenzsequenz │
├───────────────────┼───────────────────────────── ─────┤
│groupTag │ Eine Zeichenfolge, die das Motiv identifiziert │
│ │ Gruppierung. Für gepaarte Motive dieses │
│ │ ist │
│ │ " / ", │
│ │ Für ungepaarte Motive entspricht dies │
│ │ MotivString │
├───────────────────┼───────────────────────────── ─────┤
│partnerMotifString │ MotivString des gepaarten Motivs │
│ │ (Motiv mit │
│ │ umgekehrt komplementär │
│ │ MotivString) │
├───────────────────┼───────────────────────────── ─────┤
│meanScore │ Mittlere Änderung Qv der erkannten │
│ │ Instanzen │
├───────────────────┼───────────────────────────── ─────┤
│meanIpdRatio │ Mittleres IPD-Verhältnis der erkannten │
│ │ Instanzen │
├───────────────────┼───────────────────────────── ─────┤
│meanCoverage │ Mittlere Abdeckung der erkannten │
│ │ Instanzen │
├───────────────────┼───────────────────────────── ─────┤
│objectiveScore │ Objektive Bewertung dieses Motivs in │
│ │ der Motivfinder-Algorithmus │
└───────────────────┴───────────────────────────── ─────┘

Verwenden Sie ipdSummary online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

  • 1
    Büroetage
    Büroetage
    OfficeFloor bietet eine Umkehrung von
    Kopplungssteuerung mit ihren: - Abhängigkeiten
    Einspritzung - Fortsetzungseinspritzung -
    Fadeninjektion Weitere Informationen
    Besuche den...
    Laden Sie OfficeFloor herunter
  • 2
    DivKit
    DivKit
    DivKit ist ein servergesteuertes Open-Source-Programm
    UI (SDUI)-Framework. Es ermöglicht Ihnen
    Bereitstellung serverbasierter Updates für
    verschiedene App-Versionen. Es kann auch sein
    verwendet für...
    Laden Sie DivKit herunter
  • 3
    Unterkonverter
    Unterkonverter
    Dienstprogramm zum Konvertieren zwischen verschiedenen
    Abonnementformat. Shadowrocket-Benutzer
    sollte ss, ssr oder v2ray als Ziel verwenden.
    Sie können &remark= hinzufügen
    Telegram-like HT...
    Unterkonverter herunterladen
  • 4
    SWASH
    SWASH
    SWASH ist eine Allzweck-Zahl
    Werkzeug zur Simulation instationärer,
    nicht hydrostatisch, freiflächig,
    Rotationsströmungs- und Transportphänomene
    in Küstengewässern als ...
    Laden Sie SWASH herunter
  • 5
    VBA-M (Archiviert – Jetzt auf Github)
    VBA-M (Archiviert – Jetzt auf Github)
    Projekt ist umgezogen
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Features: Cheat-Erstellung, Staaten speichern, Multi
    system, unterstützt gba, gbc, gb, sgb,
    sgb2Tu...
    VBA-M herunterladen (archiviert – jetzt auf Github)
  • 6
    Stacer
    Stacer
    Linux-Systemoptimierung und -überwachung
    Github-Repository:
    https://github.com/oguzhaninan/Stacer.
    Zielgruppe: Endbenutzer/Desktop. Benutzer
    Schnittstelle: Qt. Programmierung La ...
    Staker herunterladen
  • Mehr »

Linux-Befehle

Ad