meryl - En ligne dans le Cloud

Il s'agit de la commande meryl qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


meryl - comptage et utilitaires de kmer dans et hors du cœur

SYNOPSIS


Estimer Mémoire exigences
Meryl -P -m taille kmer [-c #] [-p] -s suite.fasta

Meryl -P -m taille kmer [-c #] [-p] -n marchand

Développement a table
Meryl -B -m taille kmer [-c #] [-p] [-v] [-f|-r|-C] [-L occurrence mineure] [-U occurrence max]
[-films n | {-segments segments | -Mémoire mégaoctets} [-configbatch [-sge nom du travail]]]
-s suite.fasta -o préfixe tbl

Meryl -compter le lot nombre [-sgebuild "qsuboptionstring"] -o préfixe tbl

Meryl -fusion par lot nombre [-sgemerge "qsuboptionstring"] -o préfixe tbl

Exécution on a table
Meryl -M opération [-v] -s préfixe tbl [-s préfixe tbl2 ...] -o sortie

Dumping a table
Meryl -Dh -s préfixe tbl

Meryl -Dt -n mincompte -s préfixe tbl

DESCRIPTION


Meryl calcule le contenu kmer des séquences génomiques. Le contenu Kmer est représenté comme un
liste des kmers et le nombre de fois que chacun se produit dans les séquences d'entrée. Le kmer peut être
limité au kmer avant, au kmer inversé ou au kmer canonique
(lexicographiquement plus petit du kmer avant et arrière à chaque endroit). Meryl vous
rapporter l'histogramme des comptages, la liste des kmers et leurs comptages, ou peut effectuer
opérations mathématiques et réglées sur les fichiers de données traités.

La sortie de Meryl est deux fichiers binaires, appelés base de données meryl, qui peuvent être rapidement
vidé pour fournir un histogramme des comptes, ou les comptes réels. Une bibliothèque C++ est fournie
pour un accès direct aux fichiers.

OPTIONS


-P Estimer les besoins en mémoire. Étant donné un fichier de séquence (-s) ou une limite supérieure sur le
nombre de mers dans le fichier (-n), calculez la taille de la table (-t dans la construction) pour minimiser
l'utilisation de la mémoire. Ce mode reconnaît les options suivantes :

-m # taille d'un mer (obligatoire)

-c # compression d'homopolymère (facultatif)

-p activer les postes

-s suite.fasta
Fichier de séquence à scanner pour déterminer le nombre de mers

-n # calculer les paramètres en supposant que le fichier contient autant de mers

Un seul de -s, -n besoin d'être précisé. Si les deux sont donnés, -s est prioritaire.

-B Calculer les tables mer-count étant donné un fichier de séquence (-s) et de nombreux paramètres. Par
par défaut, les deux brins sont traités.

-f construire uniquement pour le brin avant

-r construire uniquement pour le brin inversé

-C utiliser des mers canoniques (en supposant les deux brins)

-L # NE PAS enregistrer les mers qui se produisent moins de # fois

-U # NE PAS enregistrer les mers qui se produisent plus de # fois

-m # taille d'un mer (obligatoire)

-c # compression d'homopolymère (facultatif)

-p activer les postes

-s suite.fasta
séquence pour construire la table pour

-o préfixe tbl
préfixe de table de sortie

-v divertir l'utilisateur

La Meryl le processus peut s'exécuter dans un grand lot de mémoire, dans de nombreux petits lots de mémoire,
ou sous contrôle SGE, le tout avec ou sans utilisation de plusieurs cœurs de processeur. Par défaut,
le calcul est effectué comme un grand processus séquentiel. Opération multi-thread
est possible, moyennant des frais de mémoire supplémentaires, tout comme le fonctionnement segmenté, à des frais supplémentaires
Frais d'E/S.

Fileté opération
Divisez le comptage en n morceaux de taille presque égale. Cela utilise un supplément
h Mo (à partir de -P) par fil.

-films n
utilisé n fils à construire

segmenté, séquentiel opération
Divisez le comptage en morceaux qui ne tiendront pas plus de m Mo de
mémoire, ou en n morceaux de taille égale. Chaque pièce est calculée séquentiellement,
et les résultats sont fusionnés à la fin. Un seul de -Mémoire et de -segments is
nécessaire.

-Mémoire m
utiliser au maximum m Mo de mémoire par segment

-segments n
utilisé n segments

segmenté, en lots opération
Identique au séquentiel, sauf que cela permet à chaque segment d'être exécuté manuellement
en parallèle. Un seul de -Mémoire et de -segments est nécessaire. Voir aussi le
EXEMPLE rubrique sur cette page.

-Mémoire m
utiliser au maximum m Mo de mémoire par segment

-segments n
utilisé n segments

-configbatch
créer les lots

-compter le lot n
exécuter le numéro de lot n

-fusion par lot
fusionner les lots

Le mode batch peut fonctionner sur la grille.

-sge nom du travail
nom de tâche unique pour cette exécution. Meryl soumettra des travaux avec le nom
mpnom du travail, NCnom du travail, nanomètrenom du travail, pour les phases préparer, compter et fusionner.

-sgebuild "options"

-sgemerge "options"
toute option supplémentaire pour qsub(1) (par exemple, "-p - 153 -pe fil 2 -A
compte merylac") NB - -N sera ignoré NB - assurez-vous de citer le
Options

-M Étant donné une liste de tables, effectuez une opération mathématique, logique ou de seuil. Sauf si
spécifié, toutes les opérations prennent n'importe quel nombre de bases de données. Les opérations mathématiques sont :

m. count est le nombre minimum pour toutes les bases de données. Si le mer n'existe PAS dans
toutes les bases de données, le mer a un compte zéro et n'est PAS dans la sortie.

minexister
count est le nombre minimum pour toutes les bases de données qui contiennent le mer

max count est le nombre maximum pour toutes les bases de données

ajouter count est la somme des décomptes pour toutes les bases de données

dessous count est le premier moins le second (binaire uniquement)

Abdos count est la valeur absolue du premier moins le second (binaire uniquement)

Les opérations logiques sont :

et de sorties mer ssi il existe dans toutes les bases de données

nand sorties mer ssi il existe dans au moins une base de données, mais pas dans toutes

or sorties mer ssi il existe dans au moins une base de données

xor sorties mer ssi il existe dans un nombre impair de bases de données

Les opérations de seuil sont :

moins que x
sorties mer ssi il a count < x

inférieur ou égal x
sorties mer ssi il a count <= x

plus grand que x
sorties mer ssi il a count > x

Meilleur que ou égal x
sorties mer ssi il a count >= x

égal x
sorties mer ssi il a count == x

Les opérations de seuil fonctionnent sur une seule base de données.

-s préfixe tbl
utilisé préfixe tbl comme base de données

-o préfixe tbl
créer cette sortie

-v divertir l'utilisateur

-D Table de vidage (tous ne fonctionnent pas)

-Jj Dump un histogramme de la distance entre les mêmes mers.

-Dt Dump mers >= un seuil. Utilisation -n pour spécifier le seuil.

-DC Comptez le nombre de mers, de mers distinctes et de mers uniques.

-Dh Dump (to stdout) un histogramme des comptes mer.

-s Lisez la table de comptage à partir d'ici (laissez le .mcdat ou le .mcidx).

EXEMPLE


Lot création of a table
Initialiser le calcul avec -configbatch, qui a besoin de toutes les options de construction. Exécuter tout
-compter le lot des emplois, alors -fusion par lot à remplir.

Meryl -configbatch -B [choix] -o filet
Meryl -compter le lot 0 -o filet
Meryl -compter le lot 1 -o filet

Meryl -compter le lot N -o filet
Meryl -fusion par lot N -o filet

Utilisez meryl en ligne en utilisant les services onworks.net



Derniers programmes en ligne Linux et Windows