GoGPT Best VPN GoSearch

Favicon OnWorks

variantCaller - Online în cloud

Rulați variantCaller în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este varianta de comandăCaller care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


variantCaller - algoritmi de apelare variante pentru datele de secvențiere PacBio

REZUMAT


variantCaller.py este invocat din linia de comandă. De exemplu, o invocare simplă este:

variantCaller.py -j8 --algorithm=quiver \
-r lambdaNEB.fa \
-o variantes.gff \
aligned_reads.cmp.h5

care solicită ca varianta de apelare să continue, - folosind 8 procese de lucru, - utilizând
freamăt algoritm, - preluarea intrărilor din fișier aligned_reads.cmp.h5, - folosind FASTA
fişier lambdaNEB.fa ca referință, - și scrierea ieșirii la variante.gff (A se vedea pbgff(5)).

O opțiune deosebit de utilă este --referenceWindow/-w: această opțiune permite utilizatorului să
direcționați instrumentul să efectueze apeluri de variante exclusiv pe a fereastră a referinței
genomul, unde

OPŢIUNI


variantCaller.py --help

va furniza un mesaj de ajutor care explică toate opțiunile disponibile.

NOTE


Intrare și producție
variantCaller.py necesită două fișiere de intrare:

· Un fișier de citiri aliniate la referință în formatul standard cmp.h5 al PacBio;

· Un fișier FASTA care a fost procesat de ReferenceUploader.

Ieșirea instrumentului este formatată în format GFF, așa cum este descris în (cum se face legătura la alte
fişier?). Instrumente externe pot fi folosite pentru a converti fișierul GFF într-un fișier VCF sau BED --- două
alte formate standard de schimb pentru apelarea variantelor.

NOTĂ:
Intrare cmp.h5 fişier Cerințe

variantCaller.py necesită ca fișierul de intrare cmp.h5 să fie sortat. Un fișier nesortat poate
sortați folosind instrumentul cmpH5Sort.py.

freamăt(1) algoritm în variantCaller necesită fișierul de intrare cmp.h5 să aibă
următor puls caracteristici:

Mesaj de sistem: ERROR/3 (doc/VariantCallerFunctionalSpecification.rst:, line 69)
Indentare neașteptată.

· InsQV,

· SubsQV,

· DelQV,

· DelTag,

· MergeQV.

multitudine(1) algoritmul poate fi rulat pe fișierele cmp.h5 cărora le lipsesc aceste caracteristici.

Fișierul de intrare este argumentul principal pentru variantCaller.py, în timp ce fișierul de ieșire este furnizat
ca argument la -o steag. De exemplu,

variantCaller.py aligned_reads.cmp.h5 -r lambda.fa -o variants.gff

va citi intrarea de la aligned_reads.cmp.h5, folosind referința lambda.fa, și trimite ieșire
la dosar variante.gff. Extensia numelui de fișier furnizat către -o steag este
semnificativ, deoarece determină formatul fișierului de ieșire. Formatele de fișiere în prezent
sprijinite, prin extensie, sunt

.gff format GFFv3

.TXT un format simplificat, care poate fi citit de om, utilizat în principal de dezvoltatori

În cazul în care -o flag nu este furnizat, comportamentul implicit este de a scoate la a variante.gff în
directorul curent.

NOTĂ:
variantCaller.py face nu modificați fișierul de intrare cmp.h5 în orice fel. Acest lucru este în contrast
la apelanții variante anterioare în uz la PacBio, care ar scrie a consens set de date către
fișierul de intrare cmp.h5.

Disponibil algoritmi
În acest moment, există doi algoritmi disponibili pentru apelarea variantelor: multitudine și freamăt.

Multitudine este o procedură simplă și foarte rapidă care numără doar cele mai frecvente citiri
baza sau bazele găsite în aliniere cu fiecare bază de referință și raportează abaterile de la
referire ca variante potențiale.

freamăt este o procedură mai complexă bazată pe algoritmi dezvoltați inițial pentru CCS.
Quiver folosește valorile de calitate (QV) furnizate de instrumentele de procesare din amonte, care
oferiți o perspectivă asupra faptului dacă inserările/ștergerile/substituțiile au fost considerate probabile la a
poziția de citire dată. Utilizarea de freamăt necesită ConsensusCore bibliotecă precum și instruit
set de parametri, care va fi încărcat dintr-o locație standard (TBD). Tolba poate fi gândită
ca o procedură de realiniere locală QV-aware.

Se preconizează că ambii algoritmi vor converge către zero erori (variante numite greșit) ca acoperire
crește; in orice caz freamăt ar trebui să convergă mult mai rapid (adică, mai puține erori la nivel scăzut
acoperire) și ar trebui să ofere o putere mai mare de detectare a variantelor la un anumit nivel de eroare.

Încredere Valorile
Ambele freamăt și multitudine pune la dispoziție o metrică de încredere pentru fiecare poziție a
secvență de consens. Încrederea ar trebui interpretată ca un posterior transformat de phred
probabilitatea ca apelul de consens să fie incorect; adică

QV = -10 \log_{10}(p_{err})

variantCaller.py clipurile au raportat valori QV la 93 --- valorile mai mari nu pot fi codificate în a
fișier standard FASTQ.

Chimie specificitate
Parametrii algoritmului Quiver sunt antrenați în funcție de chimie. Se încarcă software-ul SMRTanalysis
metadate în cmp.h5 pentru a indica chimia folosită pe film. Quiver vede acest tabel
și alege automat setul de parametri corespunzător de utilizat. Această selecție poate fi
suprascris de un flag de linie de comandă.

Când mai multe chimie sunt reprezentate în citirile din a cmp.h5, Quiver va modela fiecare
citiți în mod corespunzător folosind setul de parametri pentru chimia sa, obținând astfel optim
rezultate.

Performanţă Cerinţe
variantCaller.py efectuează apelarea variantelor în paralel folosind mai multe procese. Muncă
divizarea și comunicarea între procese sunt gestionate folosind Python multiprocesare
modul. Munca poate fi împărțită într-un număr arbitrar de procese (folosind programul -j
flag-line de comandă), dar pentru performanță optimă nu ar trebui să utilizați mai multe procese de lucru decât
există procesoare în computerul gazdă.

Timpul de rulare al multitudine algoritmul nu trebuie să depășească durata de rulare a BLSR
proces care a produs cmp.h5. Timpul de rulare al freamăt algoritmul nu ar trebui
depășește de 4 ori durata de execuție a BLSR.

Cantitatea de memorie de bază (RAM) utilizată între toate procesele Python lansate de a
variantCaller.py rulare nu trebuie să depășească dimensiunea intrării necomprimate .cmp.h5 fișier.

Utilizați variantCaller online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

Comenzi Linux

Ad




×
publicitate
❤️Cumpără, rezervă sau cumpără aici — gratuit, contribuind la menținerea serviciilor gratuite.