Il s'agit de la commande featureCounts qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
featureCounts - un programme de résumé de lecture très efficace et précis
UTILISATION
featureCounts [choix] -a -o fichier_entrée1 [fichier_entrée2]
Arguments requis :
-a
Nom d'un fichier d'annotations. Format GTF par défaut. Voir -F option pour plus de formats.
-o
Nom du fichier de sortie, y compris le nombre de lectures. Un fichier séparé comprenant un résumé
les statistiques des résultats de comptage sont également incluses dans la sortie (` .sommaire')
fichiers_entrée
Liste des fichiers d'entrée au format BAM ou SAM. Les utilisateurs n'ont pas besoin de spécifier qu'il s'agit de BAM ou
SAM.
Arguments facultatifs :
-A
Nom d'un fichier délimité par des virgules, y compris les noms d'alias de chromosome utilisés pour faire correspondre
les noms de chromosomes utilisés dans l'annotation avec ceux utilisés dans l'entrée BAM/SAM, s'ils sont
différent. Voir le Guide de l'utilisateur pour le format de fichier.
-F
Spécifiez le format du fichier d'annotation fourni. Les formats acceptables incluent « GTF » et
'SAF'. 'GTF' par défaut. Voir le Guide de l'utilisateur pour une description du format SAF.
-t
Spécifiez le type d'entité dans l'annotation GTF. « exon » par défaut. Fonctionnalités utilisées pour la lecture
le comptage sera extrait de l'annotation à l'aide de la valeur fournie.
-g
Spécifiez le type d'attribut dans l'annotation GTF. `gene_id' par défaut. Méta-fonctionnalités utilisées
pour la lecture, le comptage sera extrait de l'annotation à l'aide de la valeur fournie.
-f Effectuez le comptage des lectures au niveau de la fonctionnalité (par exemple, comptez les lectures pour les exons plutôt que
gènes).
-O Attribuez des lectures à toutes leurs méta-fonctionnalités qui se chevauchent (ou fonctionnalités si -f is
spécifié).
-s
Effectuez un comptage de lecture spécifique au brin. Valeurs possibles : 0 (non échoué), 1
(brins) et 2 (brins inverses). 0 par défaut.
-M Les lectures multi-mapping seront également comptées. Pour une lecture multimapping, tous ses rapports
les alignements seront comptés. La balise « NH » dans l'entrée BAM/SAM est utilisée pour détecter
lectures multi-mapping.
-Q
Le score de qualité de mappage minimal qu'une lecture doit satisfaire pour être compté. Pour
lectures appariées, au moins une extrémité doit satisfaire à ce critère. 0 par défaut.
-T
Nombre de fils. 1 par défaut.
-v Version de sortie du programme.
-J Comptez le nombre de lectures prenant en charge chaque jonction exon-exon. Les jonctions étaient
identifié à partir de ces lectures couvrant l'exon dans l'entrée (contenant 'N' dans CIGAR
chaîne de caractères). Les résultats du comptage sont enregistrés dans un fichier nommé ' .jcounts'
-G
Le fichier Fasta contenant le génome de référence utilisé pour générer le SAM d'entrée ou
fichiers BAM. Cet argument n'est nécessaire que lors du comptage de jonctions.
-R Sortir le résultat d'affectation détaillé pour chaque lecture. Un fichier texte sera généré pour
chaque fichier d'entrée, y compris les noms de lectures et les lectures de méta-fonctionnalités/fonctionnalités ont été
assigné à. Voir le Guide de l'utilisateur pour plus de détails.
--plusgrandchevauchement
Attribuer des lectures à une méta-fonctionnalité/fonctionnalité qui a le plus grand nombre de chevauchements
socles.
--minChevauchement
Spécifiez le nombre minimum de bases chevauchantes requises entre une lecture et une
meta-feature/feature à laquelle la lecture est affectée. 1 par défaut.
--read2pos <5:3>
Réduisez les lectures à leur base maximale de 5' ou de leur base maximale de 3'. Le comptage des lectures est ensuite effectué
sur la base de la base unique à laquelle la lecture est réduite.
--readExtension5 Les lectures sont étendues en amont par bases de leur
5' fin.
--readExtension3 Les lectures sont étendues en amont par bases de leur
3' fin.
--fraction
Utilisez un compte fractionnaire 1/n, au lieu de 1 (un) compte, pour chaque alignement signalé
d'une lecture multi-mapping en lecture comptage. n est le nombre total d'alignements signalés
pour la lecture multi-mapping. Cette option doit être utilisée avec l'option '-M'.
--primaire
Ne comptez que les alignements principaux. Les alignements primaires sont identifiés à l'aide du bit 0x100 dans
Champ DRAPEAU SAM/BAM.
--ignoreDup
Ignorer les lectures en double dans le comptage des lectures. Les lectures en double sont identifiées à l'aide de bit
Ox400 dans le champ BAM/SAM FLAG. La paire de lecture entière est ignorée si l'une des lectures est
une lecture en double pour les données de fin appariées.
--countSplitAlignmentsOnly Ne comptez que les alignements fractionnés (c'est-à-dire les alignements avec
Chaîne CIGAR contenant 'N'). Un exemple d'alignements fractionnés est les lectures exon-spanning
dans les données RNA-seq.
-p Comptez les fragments (paires de lecture) au lieu de lectures individuelles. Pour chaque paire de lecture, son
deux lectures doivent être adjacentes dans l'entrée BAM/SAM.
-P Vérifiez la validité de la distance appariée lors du comptage des paires de lecture. Utilisation -d ainsi que -D à
fixer des seuils.
-d
Longueur minimale du fragment/modèle, 50 par défaut.
-D
Longueur maximale de fragment/modèle, 600 par défaut.
-B Comptez uniquement les paires de lecture dont les deux extrémités sont correctement alignées.
-S
Spécifiez l'orientation de deux lectures de la même paire, 'fr' par défaut
(avant/arrière).
-C Ne comptez pas les paires de lecture dont les deux extrémités correspondent à des chromosomes différents
ou cartographie sur le même chromosome mais sur des brins différents.
--ne pas trier
Ne triez pas les lectures dans l'entrée BAM/SAM. Notez que les lectures de la même paire sont nécessaires
être situés l'un à côté de l'autre dans l'entrée.
--maxMOp
Nombre maximal d'opérations « M » autorisées dans une chaîne CIGAR . 10 par défaut. Les deux
« X » et « = » sont traités comme « M » et les opérations « M » adjacentes sont fusionnées dans le CIGAR
chaîne.
Utiliser featureCounts en ligne à l'aide des services onworks.net