EngelsFransSpaans

Ad


OnWorks-favicon

ipdSummary - Online in de cloud

Voer ipdSummary uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht ipdSummary die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


ipdSummary - Detecteer DNA-base-modificaties op basis van kinetische handtekeningen.

PRODUCTBESCHRIJVING


kineticsTool laadt IPD's die op elke positie in het genoom zijn waargenomen, en vergelijkt die IPD's
de verwachte waarde voor ongemodificeerd DNA, en geeft het resultaat van deze statistische test weer.
De verwachte IPD-waarde voor ongemodificeerd DNA kan afkomstig zijn van een in silico onder controle te houden of
versterkte onder controle te houden. De in silico-controle is getraind door PacBio en geleverd met de
pakket. Het voorspelt de IPD met behulp van de lokale reekscontext rond de stroom
positie. Een geamplificeerde controlegegevensset wordt gegenereerd door ongemodificeerd DNA te sequencen met behulp van de
dezelfde volgorde als het testmonster. Een versterkt controlemonster wordt gewoonlijk gegenereerd door
amplificatie van het hele genoom van het originele monster.

Wijziging Opsporing
De basismodus van kineticsTools voert een onafhankelijke vergelijking uit van IPD's op elke positie
het genoom, voor elke streng, en verzendt verschillende statistieken naar CSV en GFF (na toepassing van een
significantiefilter).

wijzigingen Identificatie
kinetiekHulpmiddelen ook heeft a Wijziging Identificatie mode dat wel decoderen multisite IPD
'vingerafdrukken' in a gereduceerd reeks of gesprekken of specifiek veranderingen. Deze kenmerken heeft de
volgend voordelen:

· Er kunnen verschillende wijzigingen worden onderscheiden die op dezelfde basis plaatsvinden (bijv
voorbeeld m5C en m4C)

· Het signaal van één wijziging wordt gecombineerd in één statistiek, waardoor het verbetert
gevoeligheid, het verwijderen van extra pieken en het correct centreren van de oproep

OPTIES


Roep dit programma op met --help om de beschikbare opties te zien.

ALGORITME


Synthetisch Controle
Uit onderzoek naar de relatie tussen IPD en sequentiecontext blijkt dat de meeste van de
variatie in gemiddelde IPD over een genoom kan worden voorspeld op basis van een sequentiecontext van 12 basen
rondom de actieve plaats van het DNA-polymerase. De grenzen van de relevante context
venster komt overeen met het venster van DNA dat in contact is met het polymerase, zoals te zien is in
DNA/polymerase-kristalstructuren. Om het proces van het vinden van DNA-modificaties te vereenvoudigen
met PacBio-gegevens bevat de tool een vooraf getrainde opzoektabel die 12-meer DNA in kaart brengt
sequenties betekenen IPD's waargenomen in de C2-chemie.

Filtering en Hoefverzorging
kineticsTools gebruikt de Mapping QV gegenereerd door BLASR en opgeslagen in het cmp.h5-bestand om
negeer lezingen die niet met vertrouwen in kaart zijn gebracht. De standaard minimaal vereiste Mapping QV is
10, wat impliceert dat BLASR dat heeft gedaan 90\% vertrouwen dat de uitlezing correct in kaart is gebracht. Vanwege
het bereik van leeslengtes die inherent zijn aan PacBio-gegevens. Dit kan worden gewijzigd door gebruik te maken van de
--mapQvThreshold opdrachtregelargument, of via het SMRTPortal-configuratiedialoogvenster voor
Wijzigingsdetectie.

Er zijn een paar kenmerken van PacBio-gegevens die speciale aandacht vereisen om dit te bereiken
goede wijzigingsdetectieprestaties. kineticsTools inspecteert de uitlijning tussen de
waargenomen basen en de referentiesequentie - zodat een IPD-meting kan plaatsvinden
opgenomen in de analyse, moet de PacBio-leessequentie overeenkomen met de referentiesequentie k
rond de verwante basis. In de huidige module k = 1 De IPD-verdeling op een bepaalde locatie is
gezien als een mengsel tussen het 'normale' incorporatieproces IPD, dat gevoelig is
aan de lokale sequentiecontext en DNA-modificaties en een vervuilend 'pauze'-proces
IPD die veel langer duren (gemiddeld >10x langer dan normaal), maar zelden voorkomen
(~1% van de IPD's). Opmerking: Ons huidige inzicht is dat pauzes niet nuttig zijn
informatie over de methyleringstoestand van het DNA, hoe zorgvuldiger de analyse ook mag zijn
gegarandeerd. Merk ook op dat wijzigingen die de ruwweg 1% van de
waargenomen IPD's worden gegenereerd door pauzegebeurtenissen. Aftopping van waargenomen IPD's op de mondiale 99e
percentiel wordt gemotiveerd door theorie uit het robuust testen van hypothesen. Sommige reekscontexten
kunnen van nature langere IPD's hebben, om te voorkomen dat er te veel gegevens in die contexten worden afgetopt, de cap
drempel wordt per context als volgt aangepast: capThreshold = max(global99,
5*modelVoorspelling, percentiel(ipdObservaties, 75))

Statistisch Testen
We testen de hypothese dat IPD's die op een bepaalde locus in de steekproef worden waargenomen, een
langere gemiddelden dan IPD's waargenomen op dezelfde locus in ongemodificeerd DNA. Als we gegenereerd hebben
een Whole Genome Amplified dataset, die DNA-modificaties verwijdert, we gebruiken een case-control,
t-test met twee steekproeven. Deze tool biedt ook een vooraf gekalibreerd 'synthetisch controle'-model
die de ongemodificeerde IPD voorspelt, gegeven een sequentiecontext van 12 basen. In de synthetische
In het controlegeval gebruiken we een t-test met één steekproef, met een aanpassing om rekening te houden met fouten in de
synthetisch controlemodel.

INGANGEN


uitgelijnd_reads.cmp.h5
Een standaard cmp.h5-bestand bevat uitlijningen en IPD-informatie levert de kinetische gegevens
gebruikt om wijzigingsdetectie uit te voeren. Het standaard cmp.h5-bestand van een SMRTportal-jobs is
data/aligned_read.cmp.h5.

Referentie Volgorde
Het gereedschap vereist de referentiereeks die wordt gebruikt om uitlijningen uit te voeren. Momenteel moet dit
worden geleverd via het pad naar een SMRTportal-referentierepository-item.

UITGANGEN


De wijzigingsdetectietool biedt resultaten in verschillende formaten die geschikt zijn voor
diepgaande statistische analyse, snelle referentie en verbruik door visualisatietools
zoals PacBio SMRTView. De resultaten worden over het algemeen geïndexeerd op basis van referentiepositie en
referentie streng. In alle gevallen verwijst de strengwaarde naar de streng die de
wijziging in DNA-monster. Vergeet niet dat het kinetische effect van de wijziging is
waargenomen in leessequenties die uitgelijnd zijn met de tegenovergestelde streng. Dus leest afstemmen op de
positieve streng bevat informatie over modificatie op de negatieve streng en ondeugd
omgekeerd, maar in deze toolkit rapporteren we altijd de streng die de vermeende waarde bevat
wijziging.

wijzigingen.csv
Het bestand modificaties.csv bevat één rij voor elk paar (referentiepositie, streng).
die in de dataset voorkomen met een dekking van minimaal x. x is standaard ingesteld op 3, maar is dat wel
configureerbaar met de vlag '--minCoverage' naar ipdSummary.py. De referentiepositie-index is
1-gebaseerd voor compatibiliteit met het gff-bestand in de R-omgeving.

uitgang kolommen
in silico onder controle te houden mode

┌────────────────┬────────────────────── ────────── ──┐
│Kolom │ Beschrijving │
├────────────────┼────────────────────── ────────── ──┤
│refId │ referentiesequentie-ID van deze │
│ │ observatie │
├────────────────┼────────────────────── ────────── ──┤
│tpl │ 1-gebaseerde sjabloonpositie │
├────────────────┼────────────────────── ────────── ──┤
│streng │ oorspronkelijke monsterstreng waarbij │
│ │ kinetiek werd gegenereerd. '0' is │
│ │ de streng van het origineel │
│ │ FASTA, '1' is tegengestelde streng │
│ │ van FASTA │
├────────────────┼────────────────────── ────────── ──┤
│basis │ de verwante basis op deze │
│ │ positie in de referentie │
├────────────────┼────────────────────── ────────── ──┤
│score │ Phred-getransformeerde pwaarde die een │
│ │ Op deze │ bestaat kinetische afwijking
│ │ positie │
└────────────────┴────────────────────── ────────── ──┘

│tGemiddelde │ begrensd gemiddelde van genormaliseerde IPD's │
│ │ waargenomen op deze positie │
├────────────────┼────────────────────── ────────── ──┤
│tErr │ afgetopte standaardfout van │
│ │ genormaliseerde IPD's waargenomen op deze │
│ │ positie (standaardafwijking / │
│ │ sqrt(dekking) │
├────────────────┼────────────────────── ────────── ──┤
│modelvoorspelling │ genormaliseerde gemiddelde IPD voorspeld door │
│ │ het synthetische controlemodel voor │
│ │ deze reekscontext │
├────────────────┼────────────────────── ────────── ──┤
│ipdRatio │ tGemiddelde / modelvoorspelling │
├────────────────┼────────────────────── ────────── ──┤
│dekking │ aantal geldige IPD's op dit │
│ │ positie (zie het gedeelte Filteren │
│ │ voor details) │
├────────────────┼────────────────────── ────────── ──┤
│frac │ schatting van de fractie van │
│ │ moleculen die de │ dragen
│ │ wijziging │
├────────────────┼────────────────────── ────────── ──┤
│fracLaag │ 2.5% betrouwbaarheidsgrens van frac │
│ │ schatting │
├────────────────┼────────────────────── ────────── ──┤
│fracUpp │ 97.5% betrouwbaarheidsgrens van frac │
│ │ schatting │
└────────────────┴────────────────────── ────────── ──┘

case-control mode

┌────────────────┬────────────────────── ────────── ──┐
│Kolom │ Beschrijving │
├────────────────┼────────────────────── ────────── ──┤
│refId │ referentiesequentie-ID van deze │
│ │ observatie │
├────────────────┼────────────────────── ────────── ──┤
│tpl │ 1-gebaseerde sjabloonpositie │
├────────────────┼────────────────────── ────────── ──┤
│streng │ oorspronkelijke monsterstreng waarbij │
│ │ kinetiek werd gegenereerd. '0' is │
│ │ de streng van het origineel │
│ │ FASTA, '1' is tegengestelde streng │
│ │ van FASTA │
├────────────────┼────────────────────── ────────── ──┤
│basis │ de verwante basis op deze │
│ │ positie in de referentie │
├────────────────┼────────────────────── ────────── ──┤
│score │ Phred-getransformeerde pwaarde die een │
│ │ Op deze │ bestaat kinetische afwijking
│ │ positie │
├────────────────┼────────────────────── ────────── ──┤
│caseMean │ gemiddelde van genormaliseerde case-IPD's │
│ │ waargenomen op deze positie │
├────────────────┼────────────────────── ────────── ──┤
│controlegemiddelde │ gemiddelde van genormaliseerde controle-IPD's │
│ │ waargenomen op deze positie │
├────────────────┼────────────────────── ────────── ──┤
│caseStd │ standaardafwijking van case-IPD's │
│ │ waargenomen op deze positie │
├────────────────┼────────────────────── ────────── ──┤
│controlStd │ standaardafwijking van controle │
│ │ IPD's waargenomen op deze positie │
└────────────────┴────────────────────── ────────── ──┘

│ipdRatio │ tGemiddelde / modelvoorspelling │
├────────────────┼────────────────────── ────────── ──┤
│testStatistiek │ t-teststatistiek │
├────────────────┼────────────────────── ────────── ──┤
│dekking │ gemiddelde van geval en controle │
│ │ dekking │
├────────────────┼────────────────────── ────────── ──┤
│controlCoverage │ aantal geldige controle-IPD's bij │
│ │ deze positie (zie Filteren │
│ │ sectie voor details) │
├────────────────┼────────────────────── ────────── ──┤
│caseCoverage │ telling van geldige case-IPD's op dit │
│ │ positie (zie het gedeelte Filteren │
│ │ voor details) │
└────────────────┴────────────────────── ────────── ──┘

wijzigingen.gff
De modificaties.gff voldoet aan de GFF versie 3-specificatie (‐
http://www.sequenceontology.org/gff3.shtml). Elke sjabloonpositie/strengpaar waarvan
p-waarde overschrijdt de p-waardedrempel en wordt weergegeven als een rij. De sjabloonpositie is op 1 gebaseerd,
volgens de GFF-specificatie. De strengkolom verwijst naar de streng die het gedetecteerde draagt
modificatie, wat de tegenovergestelde streng is van de strengen die worden gebruikt om de modificatie te detecteren. De
GFF-betrouwbaarheidskolom is een Phred-getransformeerde p-waarde van detectie.

Note on genoom browser verenigbaarheid

Het bestand modificaties.gff werkt niet rechtstreeks met de meeste genoombrowsers. Je zal
waarschijnlijk moet u een kopie maken van het GFF-bestand en de _seqid_-kolommen converteren van de
generieke 'ref0000x'-namen gegenereerd door PacBio, naar de FASTA-headers die aanwezig zijn in het origineel
referentie FASTA-bestand. De toewijzingstabel wordt geschreven in de header van de modificaties.gff
bestand in #reeks-header labels. Dit probleem wordt opgelost in versie 1.4 van
kinetiekHulpmiddelen.

De aanvullende gegevenskolom van het GFF-bestand bevat andere statistieken die nuttig kunnen zijn
stroomafwaartse analyse of filtering. Met name de dekkingsgraad van de reads die je gewend bent
de oproep doen, en +/- 20 bp sequentiecontext rondom de site.

┌───────────┬───────────────────────────────────────────────────────
│Kolom │ Beschrijving │
├───────────┼───────────────────────────────────────────────────────
│seqid │ Fasta contig-naam │
├───────────┼───────────────────────────────────────────────────────
│bron │ Naam van het hulpmiddel -- 'kinModCall' │
├───────────┼───────────────────────────────────────────────────────
│type │ Wijzigingstype -- in │
│ │ identificatiemodus dit zal │ zijn
│ │ m6A, m4C of m5C voor geïdentificeerde │
│ │ basen, of de generieke tag │
│ │ 'modified_base' als een kinetische │
│ │ gebeurtenis gedetecteerd die niet │
│ │ komt overeen met een bekende wijziging │
│ │ handtekening │
├───────────┼───────────────────────────────────────────────────────
│start │ Wijzigingspositie op contig │
├───────────┼───────────────────────────────────────────────────────
│einde │ Wijzigingspositie op contig │
├───────────┼───────────────────────────────────────────────────────
│score │ Phred transformeerde de p-waarde van │
│ │ detectie - dit is de │
│ │ p-waarde voor detectie op één locatie │
├───────────┼───────────────────────────────────────────────────────
│streng │ Monsterstreng met │
│ │ wijziging │
└───────────┴───────────────────────────────────────────────────────

│fase │ Niet van toepassing │
├───────────┼───────────────────────────────────────────────────────
│attributen │ Extra velden relevant voor basis │
│ │ modificaties. IPDRatio is traditioneel │
│ │ IPDRatio, context is de │
│ │ referentiesequentie -20bp tot │
│ │ +20bp rond de wijziging, │
│ │ en dekkingsniveau is het getal │
│ │ van IPD-waarnemingen gebruikt na │
│ │ QV-filtering in kaart brengen en │
│ │ nauwkeurigheidsfiltering. Als de rij │
│ │ is het resultaat van een geïdentificeerde │
│ │ wijziging voegen we ook een │ toe
│ │ identificatieQv-tag met de │
│ │ van de wijziging │
│ │ identificatieprocedure. │
│ │ identificatieQv is de │
│ │ phred-getransformeerde waarschijnlijkheid van │
│ │ een onjuiste identificatie, voor │
│ │ basen die werden geïdentificeerd als │
│ │ een bepaalde │ hebben
│ │ wijziging. frac, fracLaag, │
│ │ fracUp zijn de geschatte │
│ │ fractie van moleculen die │ dragen
│ │ de wijziging, en de 5% │
│ │ betrouwbaarheidsintervallen van de │
│ │ schatting. De gemethyleerde │
│ │ breukschatting is een │
│ │ bèta-niveau functie, en zou │
│ │ alleen voor verkennende │ gebruiken
│ │ doeleinden. │
└───────────┴───────────────────────────────────────────────────────

motieven.gff
Als de Motif Finder-tool wordt uitgevoerd, genereert deze motieven.gff, een opnieuw verwerkte versie
van modificaties.gff met de volgende wijzigingen. Als een gedetecteerde wijziging plaatsvindt op a
motief gedetecteerd door de motiefzoeker, wordt de wijziging geannoteerd met motiefgegevens. Een
attribuut 'motief' wordt toegevoegd dat de motiefreeks bevat, en een attribuut 'id' wordt toegevoegd
met de motief-ID, wat de motiefreeks is voor ongepaarde motieven of
'motifString1/motifString2' voor gepaarde motieven. Als er een motiefinstantie in het genoom bestaat,
maar werd niet gedetecteerd in modificaties.gff, er wordt een vermelding toegevoegd aan motieven.gff, die de
aanwezigheid van dat motief en de kinetiek die op die plek werd waargenomen.

motief_samenvatting.csv
Als de Motif Finder-tool wordt uitgevoerd, wordt motive_summary.csv gegenereerd, waarin de gewijzigde
motieven ontdekt door de tool. Het CSV bevat één rij per gedetecteerd motief, met de
volgende kolommen

┌───────────────────┬─────────────────── ────────── ─────┐
│Kolom │ Beschrijving │
├───────────────────┼─────────────────── ────────── ─────┤
│motiefString │ Gedetecteerde motiefreeks │
├───────────────────┼─────────────────── ────────── ─────┤
│centerPos │ Positie in motief van │
│ │ wijziging (0-gebaseerd) │
├───────────────────┼─────────────────── ────────── ─────┤
│fractie │ Fractie van instanties van deze │
│ │ motief met wijziging QV hierboven │
│ │ de QV-drempel │
├───────────────────┼─────────────────── ────────── ─────┤
│nGedetecteerd │ Aantal exemplaren van deze │
│ │ motief met bovendrempel │
└───────────────────┴─────────────────── ────────── ─────┘

│nGenoom │ Aantal exemplaren van deze │
│ │ motief in referentiereeks │
├───────────────────┼─────────────────── ────────── ─────┤
│groupTag │ Een string die het motief identificeert │
│ │ groepering. Voor gepaarde motieven is dit │
│ │ is │
│ │ " / ", │
│ │ Voor ongepaarde motieven is dit gelijk aan │
│ │ motiefString │
├───────────────────┼─────────────────── ────────── ─────┤
│partnerMotiefString │ motiefString van gepaard motief │
│ │ (motief met │
│ │ omgekeerd-complementair │
│ │ motiefString) │
├───────────────────┼─────────────────── ────────── ─────┤
│meanScore │ Gemiddelde wijziging Qv van gedetecteerde │
│ │ exemplaren │
├───────────────────┼─────────────────── ────────── ─────┤
│meanIpdRatio │ Gemiddelde IPD-ratio van gedetecteerde │
│ │ exemplaren │
├───────────────────┼─────────────────── ────────── ─────┤
│gemiddelde dekking │ Gemiddelde dekking van gedetecteerde │
│ │ exemplaren │
├───────────────────┼─────────────────── ────────── ─────┤
│objectiveScore │ Objectieve score van dit motief in │
│ │ het motiefzoekeralgoritme │
└───────────────────┴─────────────────── ────────── ─────┘

Gebruik ipdSummary online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

  • 1
    KantoorVloer
    KantoorVloer
    OfficeFloor biedt inversie van
    koppelingsbesturing, met zijn: - afhankelijkheid
    injectie - vervolg injectie -
    schroefdraadinjectie Voor meer informatie
    bezoek de...
    OfficeFloor downloaden
  • 2
    DivKit
    DivKit
    DivKit is een open source servergestuurd programma
    UI (SDUI)-framework. Het staat je toe
    server-source updates uitrollen naar
    verschillende app-versies. Het kan ook zo zijn
    gebruikt voor...
    DivKit downloaden
  • 3
    subconverter
    subconverter
    Hulpprogramma om te converteren tussen verschillende
    abonnement formaat. Shadowrocket-gebruikers
    moet ss, ssr of v2ray als doel gebruiken.
    U kunt &opmerking= toevoegen aan
    Telegram-geliefde HT...
    Subconverter downloaden
  • 4
    SWASH
    SWASH
    SWASH is een numerieke waarde voor algemeen gebruik
    hulpmiddel voor het simuleren van instabiele,
    niet-hydrostatisch, vrij oppervlak,
    rotatiestroming en transportverschijnselen
    in kustwateren als ...
    SWASH downloaden
  • 5
    VBA-M (gearchiveerd - nu op Github)
    VBA-M (gearchiveerd - nu op Github)
    Project is verplaatst naar
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Functies:Cheat creaties opslaan van statenmulti
    systeem, ondersteunt gba, gbc, gb, sgb,
    sgb2Tu...
    VBA-M downloaden (gearchiveerd - nu op Github)
  • 6
    Stacer
    Stacer
    Linux-systeemoptimalisatie en -bewaking
    Github-opslagplaats:
    https://github.com/oguzhaninan/Stacer.
    Doelgroep: eindgebruikers/desktop. Gebruiker
    interface: Qt. Programmeerla...
    Stacer downloaden
  • Meer "

Linux-commando's

Ad