AnglaisFrançaisEspagnol

Ad


Icône de favori OnWorks

bgzip - En ligne dans le Cloud

Exécutez bgzip dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande bgzip qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


bgzip - Utilitaire de compression/décompression de blocs

tabix - Indexeur générique pour les fichiers de position du génome délimité par TAB

SYNOPSIS


bgzip [-cdhB] [-b décalage virtuel] [-s taille] [filet]

tabix [-0lf] [-p gff|lit|sam|vcf] [-s ColSéq] [-b mendier] [-e finCol] [-S ligneSauter] [-c
métaChar] dans.tab.bgz [region1 [region2 [ ]]]

DESCRIPTION


Tabix indexe un fichier de position du génome délimité par des tabulations dans.tab.bgz et crée un fichier d'index (
dans.tab.bgz.tbi or dans.tab.bgz.csi ) quand région est absent de la ligne de commande. L'entrée
le fichier de données doit être trié par position et compressé par bgzip qui a un gzip(1 J'aime
interface. Après l'indexation, tabix est capable de récupérer rapidement les lignes de données qui se chevauchent
régions spécifié au format "chr:beginPos-endPos". La récupération rapide des données fonctionne également
réseau si l'URI est donné comme nom de fichier et dans ce cas le fichier d'index sera téléchargé
s'il n'est pas présent localement.

INDEXAGE OPTIONS


-0, --base zéro
Spécifiez que la position dans le fichier de données est basée sur 0 (par exemple, les fichiers UCSC) plutôt
à base de 1.

-b, - commencer INT
Colonne de la position chromosomique de départ. [4]

-c, --commenter CARBONISER
Sauter les lignes commençant par le caractère CHAR. [#]

-Ç, --csi Sauter les lignes commençant par le caractère CHAR. [#]

-e, --finir INT
Colonne de la position chromosomique finale. La colonne de fin peut être la même que le début
colonne. [5]

-F, --Obliger
Forcer l'écrasement du fichier d'index s'il est présent.

-m, --min-décalageINT
définir la taille d'intervalle minimale pour les indices CSI à 2^INT [14]

-p, --prédéfini STR
Format d'entrée pour l'indexation. Les valeurs valides sont : gff, bed, sam, vcf. Cette option
ne doit pas être appliqué avec l'un des -s, -b, -e, -c ainsi que -0; il n'est pas utilisé
pour la récupération des données car ce paramètre est stocké dans le fichier d'index. [gff]

-Oui, --séquence INT
Colonne du nom de la séquence. Option -s, -b, -e, -S, -c ainsi que -0 sont tous stockés dans le
fichier d'index et n'est donc pas utilisé dans la récupération de données. [1]

-S, --saute les lignes INT
Ignore les premières lignes INT du fichier de données. [0]

REQUÊTE ET AUTRES OPTIONS


-h, --impression-en-tête
Imprimez également les lignes d'en-tête/méta.

-H, --seulement-en-tête
Imprimez uniquement les lignes d'en-tête/méta.

-je, --fichier-info
Imprimer les informations sur le format de fichier.

-l, --list-chromes
Répertoriez les noms de séquence stockés dans le fichier d'index.

-r, --réen-tête DOSSIER
Remplacez l'en-tête par le contenu de FILE

-R, --Régions DOSSIER
Limiter aux régions répertoriées dans le FICHIER. Le FICHIER peut être un fichier BED (nécessite .bed,
.bed.gz, .bed.bgz extension de nom de fichier) ou un fichier délimité par des tabulations avec CHROM, POS,
et, éventuellement, les colonnes POS_TO, où les positions sont basées sur 1 et inclusives. Lorsque
cette option est en cours d'utilisation, le fichier d'entrée peut ne pas être trié. Régions.

-T, --cibles DOSSIER
Similaire à -R mais l'intégralité de l'entrée sera lue de manière séquentielle et les régions non répertoriées
dans FILE sera ignoré.

EXEMPLE


(grep ^"#" in.gff; grep -v ^"#" in.gff | sort -k1,1 -k4,4n) | bgzip > trié.gff.gz;

tabix -p gff trié.gff.gz;

tabix trié.gff.gz chr1 : 10,000,000 20,000,000 XNUMX-XNUMX XNUMX XNUMX ;

NOTES


Il est simple de réaliser des requêtes de chevauchement en utilisant l'index B-tree standard (avec ou
sans binning) implémenté dans toutes les bases de données SQL, ou l'index R-tree dans PostgreSQL et
Oracle. Mais il existe encore de nombreuses raisons d'utiliser tabix. Premièrement, tabix fonctionne directement avec
de nombreux formats délimités par des tabulations largement utilisés tels que GFF/GTF et BED. Nous n'avons pas besoin de
concevoir un schéma de base de données ou des formats binaires spécialisés. Les données n'ont pas besoin d'être dupliquées dans
différents formats non plus. Deuxièmement, tabix fonctionne sur des fichiers de données compressés alors que la plupart des SQL
les bases de données ne le font pas. L'annotation GenCode GTF peut être compressée jusqu'à 4%. Troisièmement, tabix
est rapide. Le même algorithme d'indexation est connu pour fonctionner efficacement pour un alignement avec un
quelques milliards de lectures courtes. Les bases de données SQL ne peuvent probablement pas facilement gérer les données à cette échelle.
Dernier point mais non le moindre, tabix prend en charge la récupération de données à distance. On peut mettre le fichier de données
et l'index sur un serveur FTP ou HTTP, et d'autres utilisateurs ou même des services Web pourront
pour obtenir une tranche sans télécharger le fichier entier.

Utilisez bgzip en ligne en utilisant les services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

  • 1
    Phaser
    Phaser
    Phaser est un open rapide, gratuit et amusant
    framework de jeu source HTML5 qui offre
    Rendu WebGL et Canvas à travers
    navigateurs Web de bureau et mobiles. Jeux
    peut être co...
    Télécharger Phaser
  • 2
    Moteur VASSAL
    Moteur VASSAL
    VASSAL est un moteur de jeu pour créer
    versions électroniques de la carte traditionnelle
    et jeux de cartes. Il fournit un soutien pour
    rendu et interaction des pièces de jeu,
    et...
    Télécharger le moteur VASSAL
  • 3
    OpenPDF - Fork d'iText
    OpenPDF - Fork d'iText
    OpenPDF est une bibliothèque Java pour créer
    et l'édition de fichiers PDF avec une licence LGPL et
    Licence open source MPL. OpenPDF est le
    LGPL/MPL open source successeur d'iText,
    un ...
    Télécharger OpenPDF - Fork d'iText
  • 4
    SAGA SIG
    SAGA SIG
    SAGA - Système d'automatisation
    Analyses géoscientifiques - est un
    Logiciel de système d'information (SIG) avec
    immenses capacités pour les géodonnées
    traitement et an...
    Télécharger le SIG SAGA
  • 5
    Boîte à outils pour Java/JTOOpen
    Boîte à outils pour Java/JTOOpen
    IBM Toolbox for Java / JTOpen est un
    bibliothèque de classes Java prenant en charge
    programmation client/serveur et internet
    modèles vers un système exécutant OS/400,
    i5/OS, ou...
    Télécharger Toolbox pour Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (ou D3 pour les documents pilotés par les données)
    est une bibliothèque JavaScript qui vous permet
    produire des données dynamiques et interactives
    visualisations dans les navigateurs Web. Avec D3
    toi...
    Télécharger D3.js
  • Plus "

Commandes Linux

Ad