Il s'agit de la commande bp_load_gffp qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
bp_load_gff.pl - Charge une base de données Bio::DB::GFF à partir de fichiers GFF.
SYNOPSIS
% bp_load_gff.pl -d testdb -u utilisateur -p pw
--dsn 'dbi:mysql:database=dmel_r5_1;host=myhost;port=myport'
dna1.fa dna2.fa fonctionnalités1.gff fonctionnalités2.gff ...
DESCRIPTION
Ce script charge une base de données Bio::DB::GFF avec les fonctionnalités contenues dans une liste de GFF
et/ou fichiers de séquence FASTA. Vous devez utiliser la variante exacte de GFF décrite dans
Bio::DB::GFF. Diverses options de ligne de commande vous permettent de contrôler la base de données à charger
et s'il faut autoriser l'écrasement d'une base de données existante.
Ce script utilise l'interface Bio::DB::GFF et fonctionne donc avec tous les adaptateurs de base de données
actuellement pris en charge par ce module (MySQL, Oracle, PostgreSQL bientôt). Cependant, il est lent.
Pour un chargement plus rapide, consultez les fichiers bp_bulk_load_gff.pl et bp_fast_load_gff.pl spécifiques à MySQL
scripts.
NOTES
Si le nom de fichier est "-", alors l'entrée est prise à partir de l'entrée standard. Comprimé
les fichiers (.gz, .Z, .bz2) sont automatiquement décompressés.
Les fichiers au format FASTA se distinguent des fichiers GFF par leurs extensions de nom de fichier. Des dossiers
se terminant par .fa, .fasta, .fast, .seq, .dna et leurs variantes majuscules sont traités comme FASTA
des dossiers. Tout le reste est traité comme un fichier GFF. Si vous souhaitez charger des fichiers -fasta depuis
STDIN, puis utilisez le swith de ligne de commande -f avec un argument de '-', comme dans
gunzip mes_données.fa.gz | bp_fast_load_gff.pl -d test -f -
Lors du premier chargement d'une base de données, vous verrez un certain nombre d'erreurs de "table inconnue". C'est
Normal.
À propos de maxfeature : la valeur par défaut est de 100,000,000 XNUMX XNUMX de bases. Si vous avez des fonctionnalités qui sont
proche ou supérieur à 100 Mo de longueur, la valeur de maxfeature doit être augmentée
à 1,000,000,000 10 XNUMX XNUMX, ou une autre puissance de XNUMX.
LIGNE DE COMMANDE OPTIONS
Les options de ligne de commande peuvent être abrégées en options à une seule lettre. par exemple -d au lieu de
--base de données.
--dsn Source de données (par défaut dbi:mysql:test)
--adaptateur Adaptateur de schéma (dbi par défaut::mysqlopt)
--utilisateur Nom d'utilisateur pour l'authentification mysql
--passe Mot de passe pour l'authentification mysql
--fasta Fichier fasta ou répertoire contenant des fichiers fasta pour l'ADN
--create Force la création et l'initialisation de la base de données
--maxfeature Définit la valeur de la taille maximale de la fonctionnalité (par défaut 100 Mo ; doit être une puissance de 10)
--group Une liste d'un ou plusieurs noms de balises (séparés par des virgules ou des espaces)
à utiliser pour le regroupement dans la 9e colonne.
--upgrade Mettre à niveau la base de données existante vers le schéma actuel
--gff3_munge Activer le munging du nom GFF3 (voir Bio::DB::GFF)
--quiet Aucun rapport d'avancement
--summary Génère des statistiques récapitulatives pour dessiner des histogrammes de couverture.
Cela peut être exécuté sur une base de données précédemment chargée ou pendant
la charge.
Utilisez bp_load_gffp en ligne à l'aide des services onworks.net