Il s'agit de la commande bp_bulk_load_gffp qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
bp_bulk_load_gff.pl - Charger en bloc une base de données Bio::DB::GFF à partir de fichiers GFF.
SYNOPSIS
% bp_bulk_load_gff.pl -d testdb dna1.fa dna2.fa fonctionnalités1.gff fonctionnalités2.gff ...
DESCRIPTION
Ce script charge une base de données Bio::DB::GFF avec les fonctionnalités contenues dans une liste de GFF
et/ou fichiers de séquence FASTA. Vous devez utiliser la variante exacte de GFF décrite dans
Bio::DB::GFF. Diverses options de ligne de commande vous permettent de contrôler la base de données à charger
et s'il faut autoriser l'écrasement d'une base de données existante.
Ce script diffère de bp_load_gff.pl en ce qu'il est codé en dur pour utiliser MySQL et ne peut pas
effectuer des charges incrémentielles. Voir bp_load_gff.pl pour un chargeur incrémentiel qui fonctionne avec
toutes les bases de données supportées par Bio::DB::GFF, et bp_fast_load_gff.pl pour un chargeur MySQL qui
prend en charge les charges incrémentielles rapides.
NOTES
Si le nom de fichier est "-", alors l'entrée est prise à partir de l'entrée standard. Comprimé
les fichiers (.gz, .Z, .bz2) sont automatiquement décompressés.
Les fichiers au format FASTA se distinguent des fichiers GFF par leurs extensions de nom de fichier. Des dossiers
se terminant par .fa, .fasta, .fast, .seq, .dna et leurs variantes majuscules sont traités comme FASTA
des dossiers. Tout le reste est traité comme un fichier GFF. Si vous souhaitez charger des fichiers -fasta depuis
STDIN, puis utilisez le swith de ligne de commande -f avec un argument de '-', comme dans
gunzip mes_données.fa.gz | bp_fast_load_gff.pl -d test -f -
La nature du chargement en bloc requiert que la base de données se trouve sur la machine locale et que
l'utilisateur indiqué a le privilège "fichier" pour charger les tables et a assez de place dans
/usr/tmp (ou tout ce qui est spécifié par la variable d'environnement \$TMPDIR), pour contenir le
tables de façon transitoire.
Les données locales peuvent maintenant être téléchargées sur un serveur distant via l'option --local avec la base de données
hôte spécifié dans le dsn, par exemple dbi:mysql:test:db_host
L'adaptateur utilisé est dbi::mysqlopt. Il n'y a actuellement aucun moyen de changer cela.
À propos de maxfeature : la valeur par défaut est de 100,000,000 XNUMX XNUMX de bases. Si vous avez des fonctionnalités qui sont
proche ou supérieur à 100 Mo de longueur, la valeur de maxfeature doit être augmentée
à 1,000,000,000 10 XNUMX XNUMX. Cette valeur doit être une puissance de XNUMX.
Notez que les utilisateurs Windows doivent utiliser l'option --create.
Si la liste des fichiers GFF ou fasta dépasse la limite du noyau pour le nombre maximum de
arguments de ligne de commande, utilisez l'option --long_list /path/to/files.
LIGNE DE COMMANDE OPTIONS
Les options de ligne de commande peuvent être abrégées en options à une seule lettre. par exemple -d au lieu de
--base de données.
--base de données Nom de la base de données (par défaut dbi:mysql:test)
--adaptor Nom de l'adaptateur (mysql par défaut)
--create Réinitialiser/créer des tables de données sans demander
--user Nom d'utilisateur pour se connecter en tant que
--fasta Fichier ou répertoire contenant les fichiers fasta à charger
--long_list Répertoire contenant un très grand nombre de
Fichiers GFF et/ou FASTA
--password Mot de passe à utiliser pour l'authentification
(Ne fonctionne pas avec Postgres, le mot de passe doit être
fourni de manière interactive ou être laissé vide pour
authentification d'identité)
--maxbin Définit la valeur de la taille maximale du bac
--local Drapeau pour indiquer que la source de données est locale
--maxfeature Définit la valeur de la taille maximale de la fonctionnalité (puissance de 10)
--group Une liste d'un ou plusieurs noms de balises (séparés par des virgules ou des espaces)
à utiliser pour le regroupement dans la 9e colonne.
--gff3_munge Activer le munging du nom GFF3 (voir Bio::DB::GFF)
--summary Génère des statistiques récapitulatives pour dessiner des histogrammes de couverture.
Cela peut être exécuté sur une base de données précédemment chargée ou pendant
la charge.
--Emplacement temporaire d'un répertoire de travail accessible en écriture
Utilisez bp_bulk_load_gffp en ligne à l'aide des services onworks.net