Ray - Online în cloud

Aceasta este comanda Ray care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


Ray - asamblează genomurile în paralel folosind interfața de transmitere a mesajelor

REZUMAT


mpiexec -n NUMBER_OF_RANKS rază -k KMERLENGTH -p l1_1.fastq l1_2.fastq -p l2_1.fastq
l2_2.fastq -o test

mpiexec -n NUMBER_OF_RANKS Ray Ray.conf # cu comenzi într-un fișier

DESCRIERE:


Asamblatorul genomului Ray este construit pe RayPlatform, un plugin generic bazat pe plugin
motor de calcul distribuit și paralel care utilizează interfața de transmitere a mesajelor pentru
transmiterea de mesaje.

Ray vizează mai multe aplicații:

- asamblarea de novo a genomului (cu vanilie Ray) - asamblarea de novo a meta-genomului (cu
Ray Meta) - ansamblu transcriptom de novo (funcționează, dar nu a fost testat mult) -
cuantificarea abundentelor contig - cuantificarea consortiilor de microbiomi
membri (cu Comunități Ray) - cuantificarea expresiei transcripției - taxonomie
profilarea probelor (cu Ray Communities) - profilarea ontologiei genetice a probelor
(cu Ray Ontologies)

-Ajutor

Afișează această pagină de ajutor.

-versiune

Afișează versiunea Ray și opțiunile de compilare.

Folosind un fișier de configurare

Ray poate fi lansat cu mpiexec -n 16 Ray Ray.conf Fișierul de configurare poate
includeți comentarii (începând cu #).

lungime K-mer

-k kmerLength

Selectează lungimea k-mers. Valoarea implicită este 21. Trebuie să fie impară deoarece
vârfurile invers-complement sunt stocate împreună. Lungimea maximă este definită la
compilare de către MAXKMERLENGTH K-merurile mai mari utilizează mai multă memorie.

Intrări

-p leftSequenceFile rightSequenceFile [deviație standard medie a distanței exterioare]

Oferă două fișiere care conțin citiri asociate. medieOuterDistance și
Deviația standard sunt calculate automat dacă nu sunt furnizate.

-i interleavedSequenceFile [avaria standard de distanță exterioară medie]

Oferă un fișier care conține citiri intercalate la capătul pereche. medieOuterDistance
și Deviația standard sunt calculate automat dacă nu sunt furnizate.

-s sequenceFile

Oferă un fișier care conține citiri cu un singur capăt.

ieşiri

-o directorul de ieșire

Specifică directorul pentru fișierele rezultate. Implicit este RayOutput

Opțiuni de asamblare (valorile implicite funcționează bine)

-dezactivarea-reciclarea

Dezactivează reciclarea citirii în timpul asamblarii citirile vor fi eliberate în 3 cazuri: 1.
distanța nu s-a potrivit pentru o pereche 2. cititul nu și-a întâlnit perechea 3. cel
populația bibliotecii indică o plasare greșită a se vedea Traversarea constrânsă a repetărilor
cu secvențe pereche. Sebastien Boisvert, Elenie Godzaridis, Francois Laviolette
& Jacques Corbeil. Primul atelier anual RECOMB Satelit pe Massively Parallel
Sequencing, 26-27 martie 2011, Vancouver, BC, Canada.

-dezactivare-schela

Dezactivează schela.

-lungimea-minima-contig minimumContigLength

Modifică lungimea minimă contig, implicit este de 100 de nucleotide

-spațiu-culor

Rulează în spațiu de culoare Necesita fișiere csfasta. Activat automat dacă fișierele csfasta
sunt furnizate.

-utilizare-acoperire-maxima-seminte maximumSeedCoverageDepth

Ignoră orice sămânță cu o adâncime de acoperire peste acest prag. Valoarea implicită este
4294967295.

-utilizare-acoperire-minima-seminte minimumSeedCoverageDepth

Setează adâncimea minimă de acoperire a semințelor. Orice cale cu o adâncime de acoperire mai mică decât
acesta va fi aruncat. Valoarea implicită este 0.

Motor de stocare distribuită (toate aceste valori sunt pentru fiecare rang MPI)

-biți-filtru-bloom biţi

Setează numărul de biți pentru filtrul Bloom. Implicit este 268435456 biți, 0 biți
dezactivează filtrul Bloom.

-hash-table-galete găleți

Setează numărul inițial de găleți. Trebuie să fie o putere de 2! Valoare implicită:
268435456

-hash-table-buckets-per-group găleți

Setează numărul de compartimente per grup pentru stocare rară. Valoare implicită: 64, trebuie să fie
între >=1 și <= 64

-pragul-factor-încărcare-tabel-hash prag

Setează pragul factorului de încărcare pentru redimensionarea în timp real Valoarea implicită: 0.75, trebuie să fie
>= 0.5 și <1

-hash-table-verbosity

Activează verbozitatea pentru motorul de stocare distribuită

Abundențe biologice

-căutare CăutareDirectory

Oferă un director care conține fișiere fasta pentru a fi căutate în graficul de Bruijn.
Abundența biologică va fi scrisă în RayOutput/BiologicalAbundances See
Documentation/BiologicalAbundances.txt

-o-o culoare-per-fișier

Setează o culoare per fișier în loc de una pe secvență. În mod implicit, fiecare secvență în
fiecare fișier are o culoare diferită. Pentru fișiere cu un număr mare de secvențe, folosind
o singură culoare per fișier poate fi mai eficientă.

Profilarea taxonomică cu grafice de Bruijn colorate

-cu-taxonomie Genome-to-Taxon.tsv TreeOfLife-Edges.tsv Taxon-Names.tsv

Oferă o taxonomie. Calculează și scrie profiluri taxonomice detaliate. Vedea
Documentation/Taxonomy.txt pentru detalii.

-ontologia genetică OntologyTerms.txt
Adnotări.txt

Oferă o ontologie și adnotări. OntologyTerms.txt este preluat de la
http://geneontology.org Annotations.txt este un fișier cu două coloane (mâner EMBL_CDS și
identificatorul ontologiei genelor) Vezi Documentație/GeneOntology.txt

Alte rezultate

-activarea-cartiere

Calculează cartiere contig în graficul de Bruijn Fișier de ieșire:
RayOutput/NeighbourhoodRelations.txt

-am

Scrie fișierul AMOS numit RayOutput/AMOS.afg Un fișier AMOS conține poziții de citire
pe contigs. Poate fi deschis cu un software cu interfață grafică pentru utilizator.

-write-kmers

Scrie graficul k-mer în RayOutput/kmers.txt Fișierul rezultat nu este utilizat de
Ray. Fișierul rezultat este foarte mare.

-marcatori de scriere-citire

Scrie marcatori de citire pe disc.

-scrie-seminţe

Scrie secvențe de ADN semințe în RayOutput/Rank .RaySeeds.fasta

-extensii-scriere

Scrie secvențe de extensie ADN în RayOutput/Rank .RayExtensions.fasta

-write-contig-paths

Scrie căi contig cu valori de acoperire în RayOutput/Rank .RayContigPaths.txt

-scriere-marker-rezumat

Scrie statistici marker.

Folosirea memoriei

-show-memory-usage

Afișează utilizarea memoriei. Datele sunt preluate de la / proc pe GNU/Linux Needs __linux__

-show-memory-allocations

Afișează evenimentele de alocare a memoriei

verbozitatea algoritmului

-arata-extensie-alegere

Afișează alegerea făcută (cu alte opțiuni) în timpul extensiei.

-show-end-context

Afișează contextul final al fiecărei extensii. Arată copiilor vârfului unde
extinderea a fost prea dificilă.

-arata-distanta-rezumat

Afișează un rezumat al distanțelor exterioare utilizate pentru o cale de extensie.

-show-consens

Arată consensul atunci când se face o alegere.

Punct de control

-scrie-puncte de control checkpointDirectory

Scrieți fișierele puncte de control

-citire-puncte de control checkpointDirectory

Citiți fișierele puncte de control

-puncte de verificare de citire-scriere checkpointDirectory

Citiți și scrieți fișierele puncte de control

Rutarea mesajelor pentru un număr mare de nuclee

-mesaje-rute

Activează routerul de mesaje Ray. Dezactivat implicit. Mesajele vor fi direcționate
în consecință, astfel încât orice rang să poată comunica direct doar cu alții câțiva.
Fără -mesaje-rute, orice rang poate comunica direct cu orice alt rang.
Fișierele generate: Routing/Connections.txt, Routing/Routes.txt și
Routing/RelayEvents.txt și Routing/Summary.txt

-tipul conexiunii tip

Setează tipul de conexiune pentru rute. Valorile acceptate sunt debruijn, hypercube,
politop, grup, aleatoriu, kautz și complet. Implicit este debruijn.

debruijn: un grafic de Bruijn complet un alfabet dat și un hipercub de diametru: a
hipercub, alfabetul este {0,1} iar vârfurile este o putere a 2 politop: un convex
politop obișnuit, alfabetul este {0,1,...,B-1} și vârfurile sunt o putere a grupului B:
model prostesc în care un reprezentant per grup poate comunica cu cei din afară
aleatoriu: modelul Erdos-Renyi kautz: un grafic de Kautz complet, care este un subgraf al unui de
Graficul Bruijn complet: un grafic complet cu toate conexiunile posibile

Cu tipul debruijn, numărul de ranguri trebuie să fie o putere a ceva.
Exemple: 256 = 16*16, 512=8*8*8, 49=7*7 și așa mai departe. În caz contrar, nu folosiți debruijn
rutare dar folosiți altul Cu tipul kautz, numărul de ranguri n trebuie să fie
n=(k+1)*k^(d-1) pentru unele k și d

-routing-graph-grade grad

Specifică gradul de ieșire pentru graficul de rutare. Consultați Documentation/Routing.txt

Testarea hardware-ului

-test-doar-rețea

Testează rețeaua și revine.

-scriere-test-rețea-date-brute

Scrie un fișier suplimentar pe rang, care detaliază testul de rețea.

-schimburi NumberOfExchanges

Setează numărul de schimburi

-dezactivare-test-rețea

Omite testul de rețea.

Depanarea

-verificarea-integritatea-mesajului

Verifică fiabilitatea datelor mesajului pentru orice mesaj nevid. adăugați „-D CONFIG_SSE_4_2”
în Makefile pentru a utiliza instrucțiunile hardware (SSE 4.2)

-run-profiler

Rulează profilerul pe măsură ce rulează codul. În mod implicit, afișați numai avertismente de granularitate.
Rularea profilelor crește timpul de rulare.

-cu-detalii-profiler

Afișează numărul de mesaje trimise și primite în fiecare metodă în fiecare timp
felii (epoci). Are nevoie -run-profiler.

-show-comunicare-evenimente

Afișează toate mesajele trimise și primite.

-arata-citire-plasare

Afișează plasarea citirii în grafic în timpul extensiei.

-debug-bule

Depanează codul balonului. Bulele pot fi cauzate de situsuri heterozigote sau erori de secvențiere
sau alte evenimente (necunoscute).

-semințele de depanare

Depanează codul seed. Semințele sunt căi din grafic care sunt probabil unice.

-debug-fuziuni

Depanează codul de fuziune.

-debug-scaffolder

Depanați schela.

DOSARE

Fișiere de intrare

Notă: formatul fișierului este determinat de extensia fișierului.

.fasta .fasta.gz (trebuie HAVE_LIBZ=y la compilare) .fasta.bz2 (trebuie HAVE_LIBBZ2=y
la compilare) .fastq .fastq.gz (necesită HAVE_LIBZ=y la compilare) .fastq.bz2
(necesită HAVE_LIBBZ2=y la compilare) .sff (citurile asociate trebuie extrase manual)
.csfasta (citiri în spațiu de culoare)

Fișiere scoase la ieșire

Schele

RayOutput/Scaffolds.fasta

Secvențele de schelă în format FASTA

RayOutput/ScaffoldComponents.txt

Componentele fiecărei schele

RayOutput/ScaffoldLengths.txt

Lungimea fiecărei schele

RayOutput/ScaffoldLinks.txt

Legături de schelă

Contigs

RayOutput/Contigs.fasta

Secvențe contigue în format FASTA

RayOutput/ContigLengths.txt

Lungimile secvențelor contigue

Rezumat

RayOutput/OutputNumbers.txt

Cifrele generale pentru asamblare

graficul de Bruijn

RayOutput/CoverageDistribution.txt

Distribuția valorilor de acoperire

RayOutput/CoverageDistributionAnalysis.txt

Analiza distribuției acoperirii

RayOutput/degreeDistribution.txt

Repartizarea gradelor de intrare și de ieșire

RayOutput/kmers.txt

grafic k-mer, opțiune necesară: -write-kmers

Fișierul rezultat nu este utilizat de Ray. Fișierul rezultat este foarte mare.

Etape de asamblare

RayOutput/SeedLengthDistribution.txt

Distribuția lungimii semințelor

RayOutput/Rang .OptimalReadMarkers.txt

Citiți markere.

RayOutput/Rang .RaySeeds.fasta

Secvențe de ADN semințe, opțiune necesară: -scrie-seminţe

RayOutput/Rang .RayExtensions.fasta

Secvențe ADN de extensie, opțiune necesară: -extensii-scriere

RayOutput/Rang .RayContigPaths.txt

Trasee contig cu valori de acoperire, opțiune necesară: -write-contig-paths

Citituri pereche

RayOutput/LibraryStatistics.txt

Estimarea distanțelor exterioare pentru citirile pereche

RayOutput/Bibliotecă .txt

Frecvențele pentru distanțele exterioare observate (dimensiunea inserării + lungimile citite)

perete despărțitor

RayOutput/NumberOfSequences.txt

Numărul de citiri din fiecare fișier

RayOutput/SequencePartition.txt

Partiție de secvență

software Ray

RayOutput/RayVersion.txt

Versiunea lui Ray

RayOutput/RayCommand.txt

Exact aceeași comandă furnizată

AMOS

RayOutput/AMOS.afg

Reprezentarea ansamblului în format AMOS, opțiune necesară: -am

Comunicare

RayOutput/MessagePassingInterface.txt

Numărul de mesaje trimise

RayOutput/NetworkTest.txt

Latențe în microsecunde

RayOutput/Rang NetworkTestData.txt

Date brute de testare a rețelei

DOCUMENTAȚIE

- mpiexec -n 1 rază -Ajutor|mai puțin (întotdeauna actualizat) - Această pagină de ajutor (întotdeauna
actualizat) - Directorul Documentație/ - Manual (Format de document portabil):
InstructionManual.tex (în Documentație) - Arhivele listelor de corespondență:
http://sourceforge.net/mailarchive/forum.php?forum_name=denovoassembler-users

AUTOR

Scris de Sebastien Boisvert.

RAPORTAREA ERRORELOR

Raportați erori la denovoassembler-users@lists.sourceforge.net Pagina principala:
<http://denovoassembler.sourceforge.net/>

DREPTURI DE AUTOR

Acest program este software gratuit: îl puteți redistribui și/sau modifica sub
termenii Licenței Publice Generale GNU, așa cum sunt publicate de Software-ul Liber
Foundation, versiunea 3 a licenței.

Acest program este distribuit în speranța că va fi util, dar FĂRĂ NICIUN
GARANȚIE; fără nici măcar garanția implicită de VANTABILITATE sau ADECVARE PENTRU A
SCOP SPECIAL. Consultați Licența publică generală GNU pentru mai multe detalii.

Ați primit o copie a licenței publice generale GNU împreună cu acest program
(vezi LICENȚĂ).

Ray 2.1.0

Licență pentru Ray: GNU General Public License versiunea 3 RayPlatform versiune: 1.1.0 Licență
pentru RayPlatform: GNU Lesser General Public License versiunea 3

MAXKMERLENGTH: 32 KMER_U64_ARRAY_SIZE: 1 Adâncimea maximă de acoperire stocată de CoverageDepth:
4294967295 MAXIMUM_MESSAGE_SIZE_IN_BYTES: 4000 de octeți FORCE_PACKING = n ASSERT = n
HAVE_LIBZ = y HAVE_LIBBZ2 = y CONFIG_PROFILER_COLLECT = n CONFIG_CLOCK_GETTIME = n
__linux__ = y _MSC_VER = n __GNUC__ = y RAY_32_BITS = n RAY_64_BITS = y MPI standard
versiune: MPI 2.1 Bibliotecă MPI: Open-MPI 1.4.2 Compiler: GNU gcc/g++ 4.4.5

Utilizați Ray online folosind serviciile onworks.net



Cele mai recente programe online Linux și Windows