Dies ist der Befehl bp_bulk_load_gffp, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
bp_bulk_load_gff.pl – Massenladen einer Bio::DB::GFF-Datenbank aus GFF-Dateien.
ZUSAMMENFASSUNG
% bp_bulk_load_gff.pl -d testdb dna1.fa dna2.fa Features1.gff Features2.gff ...
BESCHREIBUNG
Dieses Skript lädt eine Bio::DB::GFF-Datenbank mit den Funktionen, die in einer Liste von GFF enthalten sind
Dateien und/oder FASTA-Sequenzdateien. Sie müssen die genaue Variante von GFF verwenden, die in . beschrieben ist
Bio::DB::GFF. Mit verschiedenen Befehlszeilenoptionen können Sie steuern, welche Datenbank geladen werden soll
und ob eine vorhandene Datenbank überschrieben werden soll.
Dieses Skript unterscheidet sich von bp_load_gff.pl dadurch, dass es für die Verwendung von MySQL fest codiert ist und dies nicht kann
Führen Sie inkrementelle Belastungen durch. Unter bp_load_gff.pl finden Sie einen inkrementellen Loader, der mit funktioniert
alle von Bio::DB::GFF unterstützten Datenbanken und bp_fast_load_gff.pl für einen MySQL-Loader, der
unterstützt schnelle inkrementelle Ladevorgänge.
ANMERKUNG
Wenn der Dateiname als "-" angegeben wird, wird die Eingabe von der Standardeingabe übernommen. Komprimiert
Dateien (.gz, .Z, .bz2) werden automatisch dekomprimiert.
Dateien im FASTA-Format unterscheiden sich von GFF-Dateien durch ihre Dateinamenerweiterungen. Dateien
die auf .fa, .fasta, .fast, .seq, .dna enden und ihre Großbuchstaben werden als FASTA . behandelt
Dateien. Alles andere wird als GFF-Datei behandelt. Wenn Sie -fasta-Dateien laden möchten von
STDIN, verwenden Sie dann den Befehlszeilenschalter -f mit einem Argument von '-', wie in
gunzip meine_daten.fa.gz | bp_fast_load_gff.pl -d test -f -
Die Art des Massenladens erfordert, dass sich die Datenbank auf dem lokalen Computer befindet
Der angegebene Benutzer hat die Berechtigung „Datei“ zum Laden der Tabellen und verfügt über genügend Platz darin
/usr/tmp (oder was auch immer durch die Umgebungsvariable \$TMPDIR angegeben wird), um die zu speichern
Tische vorübergehend.
Lokale Daten können jetzt über die Option --local mit der Datenbank auf einen Remote-Server hochgeladen werden
im DSN angegebener Host, z. B. dbi:mysql:test:db_host
Der verwendete Adapter ist dbi::mysqlopt. Derzeit gibt es keine Möglichkeit, dies zu ändern.
Über maxfeature: Der Standardwert ist 100,000,000 Basen. Wenn Sie über Funktionen verfügen, die
in der Nähe von oder größer als 100 MB, dann sollte der Wert von maxfeature erhöht werden
bis 1,000,000,000. Dieser Wert muss eine Zehnerpotenz sein.
Beachten Sie, dass Windows-Benutzer die Option --create verwenden müssen.
Wenn die Liste der GFF- oder Fasta-Dateien das Kernel-Limit für die maximale Anzahl überschreitet
Verwenden Sie für Befehlszeilenargumente die Option --long_list /path/to/files.
BEFEHLSZEILE OPTIONAL
Befehlszeilenoptionen können zu Einzelbuchstabenoptionen abgekürzt werden. zB -d statt
--Datenbank.
--Datenbank Datenbankname (Standard dbi:mysql:test)
--adaptor Adaptername (Standard-MySQL)
--create Datentabellen ohne Nachfrage neu initialisieren/erstellen
--user Benutzername zum Anmelden
--fasta Datei oder Verzeichnis, das die zu ladenden Fasta-Dateien enthält
--long_list Verzeichnis mit einer sehr großen Anzahl von
GFF- und/oder FASTA-Dateien
--password Passwort zur Authentifizierung
(Funktioniert nicht mit Postgres, Passwort muss vorhanden sein
interaktiv bereitgestellt oder leer gelassen werden
Identitätsauthentifizierung)
--maxbin Legt den Wert der maximalen Bin-Größe fest
--local Flag, das angibt, dass die Datenquelle lokal ist
--maxfeature Legen Sie den Wert der maximalen Feature-Größe fest (Zehnerpotenz).
--group Eine Liste mit einem oder mehreren Tag-Namen (durch Kommas oder Leerzeichen getrennt)
zur Gruppierung in der 9. Spalte zu verwenden.
--gff3_munge GFF3-Namensmunging aktivieren (siehe Bio::DB::GFF)
--summary Generiert zusammenfassende Statistiken zum Zeichnen von Coverage-Histogrammen.
Dies kann auf einer zuvor geladenen Datenbank oder während
die Ladung.
--Temporärer Speicherort eines beschreibbaren Scratch-Verzeichnisses
Verwenden Sie bp_bulk_load_gffp online über die Dienste von onworks.net
