AnglaisFrançaisEspagnol

Ad


Icône de favori OnWorks

ipdSummary - En ligne dans le Cloud

Exécutez ipdSummary dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande ipdSummary qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks à l'aide de l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


ipdSummary - Détectez les modifications de base d'ADN à partir des signatures cinétiques.

DESCRIPTION


kineticsTool charge les IPD observées à chaque position du génome et compare ces IPD
à la valeur attendue pour l'ADN non modifié, et génère le résultat de ce test statistique.
La valeur IPD attendue pour l'ADN non modifié peut provenir d'un in silico des bactéries ou d’une
amplifiée des bactéries. Le contrôle in silico est formé par PacBio et expédié avec le
emballer. Il prédit prédit l'IPD en utilisant le contexte de séquence locale autour du courant
position. Un ensemble de données de contrôle amplifié est généré par séquençage d'ADN non modifié avec le
même séquence que l'échantillon d'essai. Un échantillon de contrôle amplifié est généralement généré par
amplification du génome entier de l'échantillon d'origine.

Modification Détection
Le mode de base de kineticsTools effectue une comparaison indépendante des IPD à chaque position sur
le génome, pour chaque brin, et émet diverses statistiques vers CSV et GFF (après application d'un
filtre de signification).

Modifications Identification
cinétiqueOutils aussi a a Modification Identification mode qui vous décoder multi-sites IPD
'empreintes' développement a réduit set of en cours of groupe de neurones modifications. Ce caractéristique a le
Abonnement avantages:

· Différentes modifications intervenant sur une même base peuvent être distinguées (par
exemple m5C et m4C)

· Le signal d'une modification est combiné en une seule statistique, améliorant
sensibilité, suppression des pics supplémentaires et centrage correct de l'appel

OPTIONS


Veuillez appeler ce programme avec --Aidez-moi pour voir les options disponibles.

ALGORITHME


Synthétique Control
Des études sur la relation entre l'IPD et le contexte de séquence révèlent que la plupart des
la variation de l'IPD moyenne à travers un génome peut être prédite à partir d'un contexte de séquence de 12 bases
entourant le site actif de l'ADN polymérase. Les limites du contexte pertinent
fenêtre correspondent à la fenêtre de l'ADN en contact avec la polymérase, comme on le voit dans
Structures cristallines d'ADN/polymérase. Pour simplifier le processus de recherche de modifications de l'ADN
avec les données PacBio, l'outil comprend une table de recherche pré-entraînée mappant l'ADN 12-mer
séquences pour signifier les IPD observées en chimie C2.

Filtration ainsi que Garniture
kineticsTools utilise le Mapping QV généré par BLASR et stocké dans le fichier cmp.h5 pour
ignorer les lectures qui ne sont pas mappées en toute confiance. Le QV de mappage minimal requis par défaut est
10, ce qui implique que BLSR a 90\% confiance que la lecture est correctement mappée. En raison de
la plage de longueurs de lecture inhérentes aux données PacBioCela peut être modifié en utilisant le
--mapQvThreshold argument de ligne de commande, ou via la boîte de dialogue de configuration SMRTPortal pour
Détection des modifications.

Il y a quelques fonctionnalités des données PacBio qui nécessitent une attention particulière afin d'atteindre
bonne performance de détection de modification. kineticsTools inspecte l'alignement entre les
bases observées et la séquence de référence -- pour qu'une mesure IPD soit
inclus dans l'analyse, la séquence de lecture PacBio doit correspondre à la séquence de référence pour k
autour de la base apparentée. Dans le module actuel k = 1 La distribution IPD à un certain locus être
considéré comme un mélange entre le processus d'incorporation « normal » IPD, qui est sensible
au contexte de la séquence locale et aux modifications de l'ADN et à un processus de « pause » contaminant
IPD qui ont une durée beaucoup plus longue (moyenne > 10 fois plus longtemps que la normale), mais se produisent rarement
(~1% des IPD). Remarque : Notre compréhension actuelle est que les pauses ne sont pas utiles
informations sur l'état de méthylation de l'ADN, cependant une analyse plus minutieuse peut être
garanti. Notez également que les modifications qui augmentent drastiquement le
les IPD observés sont générés par des événements de pause. Plafonnement des IPD observées au 99e mondial
centile est motivé par la théorie de tests d'hypothèses robustes. Quelques contextes de séquence
peut avoir des IPD naturellement plus longs, pour éviter de limiter trop de données dans ces contextes, le plafond
seuil est ajusté par contexte comme suit : capThreshold = max(global99,
5*modelPrediction, percentile (ipdObservations, 75))

Statistique Essais
Nous testons l'hypothèse selon laquelle les IPD observées à un locus particulier de l'échantillon ont une
des moyennes plus longues que les IPD observées au même locus dans l'ADN non modifié. Si nous avons généré
un ensemble de données Whole Genome Amplified, qui supprime les modifications de l'ADN, nous utilisons un cas-témoin,
test t à deux échantillons. Cet outil fournit également un modèle de « contrôle synthétique » pré-calibré
qui prédit l'IPD non modifié, étant donné un contexte de séquence de 12 bases. Dans le synthétique
cas de contrôle, nous utilisons un test t à un échantillon, avec un ajustement pour tenir compte de l'erreur dans le
modèle de contrôle synthétique.

ENTRÉES


lectures_alignées.cmp.h5
Un fichier cmp.h5 standard contient les alignements et les informations IPD fournissent les données cinétiques
utilisé pour effectuer la détection de modification. Le fichier cmp.h5 standard d'un travail SMRTportal est
data/aligned_read.cmp.h5.

Référence Séquence
L'outil requiert la séquence de référence utilisée pour effectuer les alignements. Actuellement, cela doit
être fourni via le chemin d'accès à une entrée du référentiel de référence SMRTportal.

SORTIES


L'outil de détection de modification fournit des résultats dans une variété de formats adaptés à
analyse statistique approfondie, référence rapide et consommation par des outils de visualisation
tels que PacBio SMRTView. Les résultats sont généralement indexés par position de référence et
brin de référence. Dans tous les cas, la valeur du brin se réfère au brin portant le
modification dans l'échantillon d'ADN. Rappelez-vous que l'effet cinétique de la modification est
observé dans les séquences de lecture s'alignant sur le brin opposé. Alors lit en s'alignant sur le
le brin positif porte des informations sur la modification sur le brin négatif et vice
versa, mais dans cette boîte à outils, nous rapportons toujours le brin contenant le putatif
modification.

modifications.csv
Le fichier modifications.csv contient une ligne pour chaque paire (position de référence, brin)
apparaissant dans l'ensemble de données avec une couverture d'au moins x. x est par défaut à 3, mais est
configurable avec l'indicateur '--minCoverage' dans ipdSummary.py. L'indice de position de référence est
1 basé sur la compatibilité avec le fichier gff de l'environnement R.

Sortie colonnes
in silico des bactéries mode

?? ??
Colonne │ Description │
?? ??
│refId │ ID de séquence de référence de ce │
│ observation │
?? ??
│tpl │ Position du modèle basé sur 1 │
?? ??
│brin │ brin d'échantillon natif où │
Des cinétiques │ │ ont été générées. '0' est
│ le brin de l'original │
│ │ FASTA, '1' est le brin opposé │
│ de FASTA │
?? ??
│base │ la base apparentée à ce │
│ │ position dans la référence │
?? ??
│score │ Pvalue transformée par Phred que a │
│ │ déviation cinétique existe à ce │
│ poste │
?? ??

│tMean │ moyenne plafonnée des IPD normalisées │
│ │ observé à cette position │
?? ??
│tErr │ erreur standard plafonnée de │
│ │ IPD normalisées observées à ce moment │
position │ │ (écart type / │
│ sqrt (couverture) │
?? ??
│modelPrediction │ IPD moyen normalisé prédit par │
│ │ le modèle de contrôle synthétique pour │
│ │ ce contexte de séquence │
?? ??
│ipdRatio │ tMean / modelPrediction │
?? ??
│couverture │ nombre d'IPD valides à ce stade │
position │ │ (voir la section Filtrage │
│ pour plus de détails) │
?? ??
│frac │ estimation de la fraction de │
│ molécules qui portent le │
│ modification │
?? ??
│fracLow │ Limite de confiance à 2.5 % de la fracturation
│ estimation │
?? ??
│fracUpp │ Limite de confiance à 97.5% de frac │
│ estimation │
?? ??

cas-témoins mode

?? ??
Colonne │ Description │
?? ??
│refId │ ID de séquence de référence de ce │
│ observation │
?? ??
│tpl │ Position du modèle basé sur 1 │
?? ??
│brin │ brin d'échantillon natif où │
Des cinétiques │ │ ont été générées. '0' est
│ le brin de l'original │
│ │ FASTA, '1' est le brin opposé │
│ de FASTA │
?? ??
│base │ la base apparentée à ce │
│ │ position dans la référence │
?? ??
│score │ Pvalue transformée par Phred que a │
│ │ déviation cinétique existe à ce │
│ poste │
?? ??
│caseMean │ moyenne des cas d'IPD normalisés │
│ │ observé à cette position │
?? ??
│controlMean │ moyenne des IPD de contrôle normalisées │
│ │ observé à cette position │
?? ??
│caseStd │ écart type des cas IPD │
│ │ observé à cette position │
?? ??
│controlStd │ écart type du contrôle │
│ │ IPD observées à cette position │
?? ??

│ipdRatio │ tMean / modelPrediction │
?? ??
│testStatistic │ statistique du test t │
?? ??
│couverture │ moyenne des cas et témoins │
│ couverture │
?? ??
│controlCoverage │ nombre d'IPD de contrôle valides à │
│ │ ce poste (voir Filtrage │
│ section pour plus de détails) │
?? ??
│caseCoverage │ nombre d'IPD de cas valides à ce stade │
position │ │ (voir la section Filtrage │
│ pour plus de détails) │
?? ??

modifications.gff
Le fichier modifications.gff est conforme à la spécification GFF Version 3 (‐
http://www.sequenceontology.org/gff3.shtml). Chaque position de gabarit/paire de brins dont
La valeur p dépasse le seuil de la valeur p s'affiche sous forme de ligne. La position du modèle est basée sur 1,
selon la spécification GFF. La colonne de brin fait référence au brin portant le
modification, qui est le brin opposé à ceux utilisés pour détecter la modification. Les
La colonne de confiance GFF est une valeur p de détection transformée par Phred.

Notes on génome navigateur compatibilité

Le fichier modifications.gff ne fonctionnera pas directement avec la plupart des navigateurs génomiques. Vous serez
probablement besoin de faire une copie du fichier GFF et de convertir les colonnes _seqid_ du
les noms génériques 'ref0000x' générés par PacBio, aux en-têtes FASTA présents dans l'original
référence fichier FASTA. La table de mappage est écrite dans l'en-tête du fichier modifications.gff
fichier dans #en-tête-séquence Mots clés. Ce problème sera résolu dans la version 1.4 de
kineticsOutils.

La colonne de données auxiliaires du fichier GFF contient d'autres statistiques qui peuvent être utiles
analyse ou filtrage en aval. En particulier le niveau de couverture des lectures utilisées pour
faire l'appel, et +/- 20 pb du contexte de séquence entourant le site.

??
Colonne │ Description │
??
│seqid │ Nom du contig Fasta │
??
│source │ Nom de l'outil -- 'kinModCall' │
??
type │ Type de modification -- dans │
│ mode d'identification ce sera │
│ │ m6A, m4C ou m5C pour identifié │
│ bases, ou la balise générique │
│ │ 'modified_base' si une cinétique │
│ │ événement détecté qui ne
│ │ correspond à une modification connue │
│ signature │
??
│start │ Modification position sur contig │
??
│fin │ Modification position sur contig │
??
│score │ Phred a transformé la valeur p de │
│ détection - c'est le │
│ │ Valeur de p de détection de site unique │
??
│brin │ Échantillon de brin contenant │
│ modification │
??

phase │ Sans objet │
??
│attributs │ Champs supplémentaires pertinents pour la base │
│ mods. IPDRatio est traditionnel │
│ │ IPDRatio, le contexte est le │
│ │ séquence de référence -20 pb à │
│ │ +20pb autour de la modification, │
│ │ et le niveau de couverture est le nombre │
│ │ des observations IPD utilisées après │
│ │ Cartographie du filtrage QV et │
│ filtrage de précision. Si la ligne │
│ │ résulte d'un identifié
│ │ modification nous incluons également un │
│ balise identificationQv avec le │
│ de la modification │
│ │ procédure d'identification. ??
│ │ identificationQv est le │
│ │ probabilité transformée par phred de │
│ │ une identification incorrecte, pour │
│ │ bases qui ont été identifiées comme │
│ │ ayant un particulier
│ modification. frac, fracBas,
│ │ fracUp sont les estimés
│ │ fraction de molécules portant │
│ la modification, et les 5% │
│ │ intervalles de confiance du │
│ estimation. Le méthylé
│ │ l'estimation de fraction est un │
│ │ fonctionnalité de niveau bêta, et devrait │
│ │ n'être utilisé qu'à des fins exploratoires │
│ fins. ??
??

motifs.gff
Si l'outil Motif Finder est exécuté, il générera motifs.gff, dont une version retraitée
de modifications.gff avec les changements suivants. Si une modification détectée se produit sur un
motif détecté par le chercheur de motifs, la modification est annotée avec les données du motif. Un
l'attribut 'motif' est ajouté contenant la chaîne de motif, et un attribut 'id' est ajouté
contenant l'identifiant du motif, qui est la chaîne de motif pour les motifs non appariés ou
'motifString1/motifString2' pour les motifs appariés. Si une instance de motif existe dans le génome,
mais n'a pas été détecté dans modifications.gff, une entrée est ajoutée à motifs.gff, indiquant le
présence de ce motif et de la cinétique observée sur ce site.

motif_summary.csv
Si l'outil Motif Finder est exécuté, motif_summary.csv est généré, résumant le
motifs découverts par l'outil. Le CSV contient une ligne par motif détecté, avec le
colonnes suivantes

?? ??
Colonne │ Description │
?? ??
│motifString │ Séquence de motifs détectée │
?? ??
│centerPos │ Position dans le motif de │
│ │ modification (basée sur 0) │
?? ??
fraction │ Fraction d'instances de ceci │
│ │ motif avec modification QV ci-dessus │
│ │ le seuil QV │
?? ??
│nDetected │ Nombre d'instances de ceci │
│ │ motif avec seuil supérieur │
?? ??

│nGenome │ Nombre d'instances de ceci │
│ │ motif dans la séquence de référence │
?? ??
│groupTag │ Une chaîne identifiant le motif │
│ regroupement. Pour les motifs appariés ce │
│ est │
│ " / ",
│ │ Pour les motifs non appariés, cela équivaut à │
│ │ motifChaîne │
?? ??
│partnerMotifString │ motifChaîne de motif apparié │
│ │ (motif avec │
│ │ inverse-complémentaire │
│ │ motifChaîne) │
?? ??
│meanScore │ Modification moyenne Qv de détecté │
│ instances │
?? ??
│meanIpdRatio │ Ratio IPD moyen des détectés
│ instances │
?? ??
│meanCoverage │ Couverture moyenne des détections │
│ instances │
?? ??
│objectiveScore │ Score objectif de ce motif en │
│ l'algorithme de recherche de motifs │
?? ??

Utilisez ipdSummary en ligne à l'aide des services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

  • 1
    BureauÉtage
    BureauÉtage
    OfficeFloor fournit l'inversion de
    commande de couplage, avec ses : - dépendances
    injection - injection de continuation -
    injection de fil Pour plus d'informations
    visiter le...
    Télécharger OfficeFloor
  • 2
    Kit Div
    Kit Div
    DivKit est un logiciel open source piloté par serveur
    Cadre d'interface utilisateur (SDUI). Il vous permet de
    déployer des mises à jour provenant du serveur pour
    différentes versions de l'application. Aussi, cela peut être
    utilisé p...
    Télécharger DivKit
  • 3
    sous-convertisseur
    sous-convertisseur
    Utilitaire pour convertir entre divers
    formule d'abonnement. Utilisateurs de Shadowrocket
    devrait utiliser ss, ssr ou v2ray comme cible.
    Vous pouvez ajouter &remark= à
    Télégramme-aimé HT...
    Télécharger le sous-convertisseur
  • 4
    SWASH
    SWASH
    SWASH est un outil numérique polyvalent
    outil de simulation d'instabilité,
    non hydrostatique, à surface libre,
    écoulement rotationnel et phénomènes de transport
    dans les eaux côtières comme ...
    Télécharger SWASH
  • 5
    VBA-M (Archivé - Maintenant sur Github)
    VBA-M (Archivé - Maintenant sur Github)
    Le projet a déménagé à
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Fonctionnalités :Création de tricheétats de sauvegardemulti
    système, prend en charge gba, gbc, gb, sgb,
    sgb2tu...
    Télécharger VBA-M (Archivé - Maintenant sur Github)
  • 6
    Stacer
    Stacer
    Optimiseur de système Linux et surveillance
    Dépôt Github :
    https://github.com/oguzhaninan/Stacer.
    Public : utilisateurs finaux/ordinateurs de bureau. Utilisateur
    interface : Qt. Programmation La...
    Télécharger Stacer
  • Plus "

Commandes Linux

Ad