Amazon Best VPN GoSearch

Icône de favori OnWorks

plink1.9 - En ligne dans le Cloud

Exécutez plink1.9 dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande plink1.9 qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


PLINK - analyse SNP du génome entier

DESCRIPTION


PLINK v1.90b3.31 64 bits (3 février 2016) https://www.cog-genomics.org/plink2 (C)
2005-2016 Shaun Purcell, Christopher Chang Licence publique générale GNU v3

Dans les définitions d'indicateur de ligne de commande qui suivent,

* [crochets] désigne un paramètre obligatoire, où le texte entre le

parenthèses décrit sa nature.

* désigne un modificateur facultatif (ou si '|' est présent, un ensemble

de modificateurs facultatifs mutuellement exclusifs).
Utilisez le texte EXACT dans le

définition, par exemple '--dummy acgt'.

* Il existe une exception à la règle des chevrons/texte exact : lorsqu'un angle

le terme entre crochets se termine par '=[valeur]', '[valeur]' désigne un paramètre variable.

* {accolades} désigne un paramètre facultatif, où le texte entre les

accolades décrit sa nature.

* Une ellipse (...) indique que vous pouvez saisir plusieurs paramètres du

type spécifié.

plink [indicateur(s) d'entrée...] {indicateur(s) de commande...} {autre(s) indicateur(s)...} plink --Aidez-moi {drapeau
noms)...}

La plupart des exécutions PLINK nécessitent exactement un ensemble de fichiers d'entrée principal. Les drapeaux suivants sont disponibles
pour définir sa forme et son emplacement :

--bfichier {prefix} : spécifiez le préfixe .bed + .bim + .fam (par défaut 'plink').

--lit [nom de fichier] : spécifiez le nom complet du fichier .bed.

--bim [nom de fichier] : spécifiez le nom complet du fichier .bim.

--fam [nom de fichier] : spécifiez le nom complet du fichier .fam.

--keep-autoconv
: Avec --déposer/--tfile/--lfile/--vcf/--bcf/--data/--23file, ne pas supprimer
ensemble de fichiers binaires générés automatiquement à la fin de l'exécution.

--déposer {préfixe}
: Spécifiez le préfixe du nom de fichier .ped + .map (par défaut 'plink').

--ped [nom de fichier] : spécifiez le nom complet du fichier .ped.

--carte [nom de fichier] : spécifiez le nom complet du fichier .map.

--no-fid
: le fichier .fam/.ped ne contient pas la colonne 1 (ID de famille).

--pas de parents
: le fichier .fam/.ped ne contient pas les colonnes 3-4 (parents).

--pas de sexe
: le fichier .fam/.ped ne contient pas la colonne 5 (sexe).

--no-phéno
: le fichier .fam/.ped ne contient pas la colonne 6 (phénotype).

--tfile {prefix} : spécifiez le préfixe du nom de fichier .tped + .tfam (par défaut 'plink').

--tped [fnom]
: spécifiez le nom complet du fichier .tped.

--tfam [fnom]
: spécifiez le nom complet du fichier .tfam.

--lfichier {prefix} : spécifiez le préfixe .lgen + .map + .fam (ensemble de fichiers au format long).

--lgén [fnom]
: spécifiez le nom complet du fichier .lgen.

--référence [fn] : spécifiez le fichier d'allèles par défaut accompagnant l'entrée .lgen.

--allèle-compte
: Lorsqu'il est utilisé avec --lfichier/--lgén + --référence, spécifie que le fichier .lgen
contient des nombres d'allèles de référence.

--vcf [nom de fichier] : spécifiez le nom complet du fichier .vcf ou .vcf.gz.

--bcf [nom de fichier] : spécifiez le nom complet du fichier BCF2.

--Les données {préfixe}
: spécifiez le préfixe Oxford .gen + .sample (par défaut 'plink').

--gen [nom de fichier] : spécifiez le nom complet du fichier .gen ou .gen.gz.

--bgen [F] : spécifiez le nom complet du fichier .bgen.

--échantillon [fname] : spécifiez le nom complet du fichier .sample.

--23fichier [fname] {FID} {IID} {sexe} {pheno} {pat. ID} {mat. IDENTIFIANT} :

Spécifiez le fichier d'entrée 23andMe.

--grm-gz {prfx}
: spécifiez le préfixe .grm.gz + .grm.id (matrice rel. GCTA).

--grm-bin {prfx} : spécifiez .grm.bin + .grm.N.bin + .grm.id (GCTA triangulaire
matrice de relations binaires) préfixe du nom de fichier.

--factice [sample ct] [SNP ct] {manquant geno freq} {manquant phéno freq}



Cela génère un faux ensemble de données d'entrée avec le nombre spécifié d'échantillons et de SNP.
Par défaut, les fréquences de génotype et de phénotype manquantes sont nulles, et les génotypes
sont As et Bs (changez ce dernier avec 'acgt'/'1234'/'12'). Le 'scalaire-phéno'
modificateur provoque la génération d'un phénotype scalaire normalement distribué au lieu de
un binaire.

--simuler [fichier de paramètres de simulation]

--simuler-qt [fichier de paramètres de simulation]

--simuler génère un faux ensemble de données d'entrée avec des SNP associés à la maladie,

tout en --simuler-qt génère un ensemble de données avec des loci de traits quantitatifs.

Les fichiers de sortie ont des noms de la forme 'plink.{extension}' par défaut. Vous pouvez changer le
préfixe 'plink' avec

--dehors [préfixe]
: spécifiez le préfixe pour les fichiers de sortie.

La plupart des exécutions nécessitent également au moins l'une des commandes suivantes :

--faire son lit

Créez un nouvel ensemble de fichiers binaires.
Contrairement au text-to-binary automatique

convertisseurs (qui ne tiennent compte que des filtres chromosomiques), cela prend en charge tous les PLINK
drapeaux de filtrage.

--faire-juste-bim

--faire-juste-fam

Variantes de --faire son lit qui n'écrit qu'un nouveau fichier .bim ou .fam.
Peut être

utilisé uniquement avec l'entrée .bim/.fam. UTILISEZ-LES AVEC PRUDENCE. Il est très facile de
désynchronisez vos données de génotype binaire et vos index .bim/.fam si vous les utilisez
commandes de manière incorrecte. Si vous avez un doute, restez avec --faire son lit.

--recoder <01 | 12> <23 | A{-transposer} | J.-C. | beagle{-nomap} | bimbam{-1chr}

| génotypes-composés | phase rapide{-1chr} | HV{-1chr} | lgen{-ref} | liste | oxford |
rlist | structure | transposer | vcf | vcf-fid | vcf-iid>
| gen-gz>

Créez un nouvel ensemble de fichiers texte avec tous les filtres appliqués.
Par défaut, le

fileset se compose d'un fichier .ped et d'un fichier .map, lisibles avec --déposer. * Le '12'
le modificateur entraîne le codage des allèles A1 (généralement mineurs) comme « 1 »

et les allèles A2 doivent être codés comme '2', tandis que '01' correspond aux cartes A1 -> 0 et A2 -> 1.

* Le modificateur '23' provoque la génération d'un fichier au format 23andMe.
Ce

ne peut être utilisé que sur les données d'un seul échantillon (--garder peut être pratique).

* Le modificateur 'AD' provoque un additif majeur de l'échantillon (0/1/2) + dominant

(het = 1, sinon 0) fichier composant, adapté au chargement depuis R, à
généré. Si vous ne voulez pas du composant dominant, utilisez plutôt « A ». Si tu as besoin
allèles non comptés à nommer dans la ligne d'en-tête, ajoutez le modificateur 'include-alt'.

* Le modificateur 'A-transpose' provoque un fichier de composant additif variant-majeur

à générer.

* Le modificateur 'beagle' provoque des fichiers .dat et .map non phasés par autosome,

lisible par les premières versions de BEAGLE, à générer, tandis que 'beagle-nomap' génère
un seul fichier .beagle.dat.

* Le modificateur 'bimbam' provoque la génération d'un ensemble de fichiers au format BIMBAM.

Si vos données d'entrée ne contiennent qu'un chromosome, vous pouvez utiliser "bimbam-1chr" à la place
pour écrire un fichier .pos.txt à deux colonnes.

* Le modificateur 'compound-genotypes' supprime l'espace entre les paires de

codes d'allèle pour la même variante lors de la génération d'un ensemble de fichiers .ped + .map.

* Le modificateur 'fastphase' provoque la création de fichiers fastPHASE par chromosome

généré.
Si vos données d'entrée ne contiennent qu'un seul chromosome, vous pouvez utiliser

'fastphase-1chr' à la place pour exclure le numéro de chromosome de l'extension de fichier.

* Le modificateur 'HV' provoque la création d'un ensemble de fichiers .ped + .info au format Haploview

généré par chromosome.
« HV-1chr » est analogue à « fastphase-1chr ».

* Le modificateur 'lgen' provoque un ensemble de fichiers au format long (chargeable avec --lfichier)

à générer, tandis que 'lgen-ref' génère un ensemble de fichiers long format (généralement) plus petit
chargeable avec --lfichier + --référence.

* Le modificateur 'list' crée une liste basée sur le génotype, tandis que 'rlist' crée

un ensemble de fichiers de génotype rare.
Avec ces formats, le "omit-nonmale-y"

Le modificateur entraîne l'omission des génotypes non mâles sur le chromosome Y.

* 'oxford' provoque la génération d'un ensemble de fichiers .gen + .sample au format Oxford.

Si vous incluez également le modificateur 'gen-gz', le fichier .gen est compressé.

* Le modificateur 'structure' provoque la génération d'un fichier au format Structure. *
'transpose' crée un ensemble de fichiers texte transposé (chargeable avec --tfile). * 'vcf',
'vcf-fid' et 'vcf-iid' entraînent la production d'un fichier VCFv4.2.

'vcf-fid' et 'vcf-iid' entraînent respectivement l'identification des identifiants familiaux ou intra-familiaux
utilisé pour les exemples d'ID dans la dernière ligne d'en-tête, tandis que 'vcf' fusionne à la fois les ID et
met un trait de soulignement entre eux. Si le modificateur 'bgz' est ajouté, le fichier VCF est
bloc-gzippé. L'allèle A2 est enregistré comme référence et normalement signalé comme non
basé sur un génome réel de référence (valeur du champ 'PR' INFO). Quand il est important pour
allèles de référence pour être correct, vous voudrez également inclure --a2-allèle et mes
--real-ref-allèles dans votre commande.

* Le modificateur 'tab' rend la sortie principalement délimitée par des tabulations au lieu de

pour la plupart délimités par des espaces.
'tabx' et 'spacex' forcent tous les onglets et tous

espaces, respectivement.

--flip-scan

(alias: --flipscan) Analyse basée sur LD pour l'incohérence des brins cas/contrôle.

--write-covar

Si un --covar le fichier est chargé, --faire son lit/--faire-juste-fam et --recoder automatiquement
générer une version mise à jour (avec tous les filtres appliqués). Cependant, si vous ne
souhaitez générer simultanément un nouveau fichier de génotype, vous pouvez utiliser --write-covar à
il suffit de produire un fichier de covariables élagué.

--write-cluster

Si les clusters sont spécifiés avec --dans/--family, cela génère un nouveau fichier de cluster
(avec tous les filtres appliqués). Le modificateur 'omit-unassigned' provoque un clustering
échantillons à exclure du fichier ; sinon leur cluster est 'NA'.

--write-set

--set-table

Si des ensembles ont été définis, --write-set vide les listes de membres des ensembles terminés par 'END'
à {préfixe de sortie}.set, tandis que --set-table écrit une table d'appartenance variante par ensemble
à {préfixe de sortie}.set.table.

--fusionner [nom de fichier .ped] [nom de fichier .map]

--fusionner [préfixe de l'ensemble de fichiers texte]

--bmerge [nom de fichier .bed] [nom de fichier .bim] [nom de fichier .fam]

--bmerge [préfixe d'ensemble de fichiers binaire]

Fusionner l'ensemble de fichiers donné avec l'ensemble de fichiers initialement chargé, en écrivant le résultat dans
{préfixe de sortie}.bed + .bim + .fam. (Il n'est plus nécessaire de simultanément
spécifier --faire son lit.)

--merge-liste [nom de fichier]

Fusionner tous les ensembles de fichiers nommés dans le fichier texte avec l'ensemble de fichiers de référence, le cas échéant
spécifié. (Cependant, cela peut également être utilisé *sans* référence ; dans ce cas,
l'ensemble de fichiers nouvellement créé est ensuite traité comme la référence par la plupart des autres PLINK
opérations.) Le fichier texte est interprété comme suit : * Si une ligne ne contient que
un nom, il est supposé être le préfixe d'un

ensemble de fichiers binaires.

* Si une ligne contient exactement deux noms, ils sont supposés être l'intégralité

noms de fichiers pour un ensemble de fichiers texte (.ped d'abord, puis .map).

* Si une ligne contient exactement trois noms, ils sont supposés être l'intégralité

noms de fichiers pour un ensemble de fichiers binaires (.bed, puis .bim, puis .fam).

--write-snplist

--list-23-indels

--write-snplist écrit un fichier .snplist répertoriant les noms de toutes les variantes

qui passent les filtres et les seuils d'inclusion que vous avez spécifiés, tandis que
--list-23-indels écrit le sous-ensemble avec des appels indel de style 23andMe (allèle D/I
codes).

--list-duplicate-vars

--list-duplicate-vars écrit un fichier .dupvar décrivant tous les groupes de

variantes avec des positions et des codes alléliques correspondants. * Par défaut, allèle A1/A2
les affectations sont ignorées ; utiliser 'require-same-ref'

pour outrepasser cela.

* Normalement, le rapport contient des codes de position et d'allèle.
Pour les supprimer

(et produire un fichier directement utilisable avec par exemple --extrait/--exclude), utilisez 'ids-only'.
Notez que cette commande échouera en mode « ids-only » si l'un des ID signalés est
Pas unique.

* 'suppress-first' entraîne l'omission du premier ID de variante dans chaque groupe

du rapport.

--fréq

--fréqx

--fréq génère une fréquence d'allèle de base (ou compte, si le « compte »

modificateur est présent) rapport.
Cela peut être combiné avec --dans/--famille

produire à la place un rapport sur la fréquence/le nombre d'allèles stratifié en grappes, ou le
modificateur 'case-control' pour signaler les fréquences alléliques de cas et de contrôle séparément.
--fréqx génère un rapport de comptage de génotypes plus détaillé, conçu pour être utilisé avec
--read-freq.

--disparu

Générez des rapports de données manquantes basés sur des échantillons et des variantes.
Si les grappes sont

défini, le rapport basé sur les variantes est stratifié en grappes.
'gz' provoque le

fichiers de sortie à compresser.

--test-accident

Vérifiez l'association entre les appels manquants et les haplotypes adjacents.

--robuste

Générez un rapport de valeur p de test exact de Hardy-Weinberg.
(Ceci ne

filtrer simultanément sur la valeur p ; utilisation --hwe pour ça.)
Avec

le modificateur 'midp', le test applique l'ajustement mid-p décrit dans Graffelman
J, Moreno V (2013) La valeur p moyenne dans les tests exacts pour l'équilibre de Hardy-Weinberg.

--mendel

Générez un rapport d'erreur Mendel.
Le modificateur 'summaries-only' provoque le

Fichier .mendel (liste de chaque erreur) à ignorer.

--het

--ibc

Estimer les coefficients de consanguinité.
--het rapporte la méthode des moments

estimations, tandis que --ibc calcule les trois valeurs décrites dans Yang J, Lee SH,
Goddard ME et Visscher PM (2011) GCTA : un outil pour le trait complexe à l'échelle du génome
Une analyse. (Cet article décrit également le calcul de la matrice de relations que nous
réimplémenter.) * Ces fonctions nécessitent des estimations MAF décentes. S'il y a très
few

échantillons dans votre ensemble de fichiers immédiat, --read-freq est pratiquement obligatoire puisque
les MAF imputés sont extrêmement inexacts dans ce cas.

* Ils supposent également que l'ensemble de marqueurs est en équilibre de liaison approximatif. * Par
défaut --het omet le multiplicateur n/(n-1) dans l'espérance de Nei

formule d'homozygotie.
Le modificateur 'small-sample' le fait être

inclus, en forçant --het d'utiliser les MAF imputés aux fondateurs dans l'immédiat
jeu de données.

--check-sexe {femelle max F} {mâle min F}

--check-sexe ycount {femelle max F} {mâle min F} {femelle max Y obs}
{homme min Y obs}

--check-sexe y-only {femelle max Y obs} {mâle min Y obs}

--impute-sexe {femelle max F} {mâle min F}

--impute-sexe ycount {femelle max F} {mâle min F} {femelle max Y obs}
{homme min Y obs}

--impute-sexe y-only {femelle max Y obs} {mâle min Y obs}

--check-sexe compare normalement les attributions de sexe dans l'ensemble de données d'entrée avec

ceux imputés à partir des coefficients de consanguinité du chromosome X. * Assurez-vous que le X
la région pseudo-autosomique du chromosome a été divisée

off (avec par exemple --split-x) avant de l'utiliser.

* Vous avez également besoin d'estimations MAF décentes (donc, avec très peu d'échantillons dans votre

ensemble de fichiers immédiat, utilisez --read-freq), et votre jeu de marqueurs doit être d'environ
équilibre de liaison.

* Par défaut, les estimations F inférieures à 0.2 donnent des cris femelles et des valeurs

supérieur à 0.8 donnent des cris mâles.
Si vous transmettez des paramètres numériques à

--check-sexe, les deux premiers contrôlent ces seuils.

Il existe maintenant deux modes qui prennent en compte les données du chromosome Y. * En mode 'ycount',
le sexe est toujours imputé à partir du chromosome X, mais

les appels féminins sont rétrogradés à ambigus chaque fois que plus de 0 Y non manquant
les génotypes sont présents et les cris des mâles sont déclassés lorsque moins de 0 sont présents.
(Notez qu'il s'agit de nombres, pas de taux.) Ces seuils sont contrôlables avec
--check-sexe les 3e et 4e paramètres numériques facultatifs de ycount.

* En mode « y uniquement », le sexe est imputé à partir du nombre de génotypes Y non manquants.

Le seuil minimum masculin est par défaut de 1 au lieu de zéro dans ce cas.

--impute-sexe change les affectations de sexe aux valeurs imputées, et est

sinon identique à --check-sexe.
Il doit être utilisé avec

--faire son lit/--recode/--write-covar.

--fst

(alias: --Premier) Estimez le Fst de Wright pour chaque variante diploïde autosomique en utilisant le
méthode introduite dans Weir BS, Cockerham CC (1984) Estimating F-statistics for the
analyse de la structure de la population, étant donné un ensemble de sous-populations définies via
--dans. Les moyennes mondiales brutes et pondérées sont également rapportées. * Si vous êtes intéressé
dans les moyens globaux, il est généralement préférable d'effectuer

ce calcul sur un marqueur placé dans un équilibre de liaison approximatif.

* Si vous n'avez que deux sous-populations, vous pouvez les représenter avec

case/control et utilisez le modificateur 'case-control'.

--indépendant [la taille de la fenêtre] [taille du pas (variante ct)] [seuil VIF]

--indep-par paire [la taille de la fenêtre] [taille du pas (variante ct)] [seuil r^2]

--indep-pairphase [la taille de la fenêtre] [taille du pas (variante ct)] [seuil r^2]

Générez une liste de marqueurs dans un équilibre de liaison approximatif.
Le

modificateur 'kb', la taille de la fenêtre est en kilobase au lieu d'unités de nombre de variantes.
(L'espace pré-'kb' est facultatif, c'est-à-dire '--indep-pairwise 500 kb 5 0.5' et
'--indep-pairwise 500kb 5 0.5' a le même effet.) Notez que vous devez réexécuter
PLINK en utilisant --extrait or --exclure sur le fichier .prune.in/.prune.out pour appliquer le
liste à un autre calcul.

--r



--r2



Rapports statistiques LD.
--r donne des corrélations intervariantes brutes, tandis que

--r2 rapporte leurs carrés.
Vous pouvez demander les résultats pour toutes les paires dans

format matriciel (si vous spécifiez 'bin' ou l'un des modificateurs de forme), toutes les paires dans
format table ('inter-chr'), ou une fenêtre limitée en format table (par défaut). * Les
Le modificateur 'gz' provoque la compression gzippée du fichier texte de sortie. * 'bin' provoque la sortie
matrice à écrire en binaire double précision

format, tandis que 'bin4' spécifie le binaire simple précision.
La matrice est

carré si aucune forme n'est explicitement spécifiée.

* Par défaut, les matrices de texte sont délimitées par des tabulations ; « espaces » change cela. *
'en phase' ajoute une colonne avec des paires d'allèles en phase au format tableau

rapports.
(Ceci ne peut pas être utilisé avec des codes d'allèle très longs.)

* 'dprime' ajoute la statistique D-prime de Lewontin aux rapports sous forme de tableau,

et force à la fois r/r^2 et D-prime à être basés sur la solution du maximum de vraisemblance pour
l'équation cubique discutée dans Gaunt T, Rodriguez S, Day I (2007) Cubic exact
solutions pour l'estimation des fréquences d'haplotypes par paires.

* 'with-freqs' ajoute des colonnes MAF aux rapports sous forme de tableau. * Depuis le résultat
fichier peut facilement être énorme, vous devez ajouter le

Modificateur 'oui-vraiment' lors de la demande de toutes les paires non filtrées et non distribuées
calcul sur plus de 400k variantes.

* Ces calculs peuvent être subdivisés par --parallèle (même lorsque le

le modificateur 'carré' est actif).

--ld [ID de variante] [ID de variante]

Cela affiche les fréquences d'haplotypes, r^2 et D' pour une seule paire de variantes.
Lorsqu'il existe plusieurs solutions biologiquement possibles à la fréquence des haplotypes
équation cubique, toutes sont affichées (au lieu de simplement la solution du maximum de vraisemblance
identifié par --r/--r2), ainsi que les statistiques de test exactes HWE.

--Voir les étiquettes [nom de fichier]

--Voir les étiquettes tous

* Si un fichier est spécifié, listez toutes les variantes qui taguent au moins une variante

nommé dans le fichier.
(Ce sera normalement un sur-ensemble de l'original

list, puisqu'une variante est considérée comme s'auto-étiquetant ici.)

* Si le mode 'tout' est spécifié, pour chaque variante, chaque *autre* variante qui

balises, il est signalé.

--blocs

Estimer les blocs d'haplotype, via l'interprétation de Haploview de la définition de bloc
suggéré par Gabriel S et al. (2002) La structure des blocs d'haplotypes chez l'humain
Génome. * Normalement, les échantillons avec des phénotypes manquants ne sont pas pris en compte par ce

calcul; le modificateur 'no-pheno-req' lève cette restriction.

* Normalement, les blocs de taille 2 ne peuvent pas dépasser 20 Ko et les blocs de taille 3

sont limités à 30 Ko.
Le modificateur 'no-small-max-span' supprime ces

limites.

Le fichier .blocks est une entrée valide pour les PLINK 1.07 --heureusement commander.
Toutefois,

le --heureusement... la famille d'indicateurs n'a pas été réimplémentée dans PLINK 1.9 en raison d'une mauvaise
précision de mise en phase par rapport à d'autres logiciels ; pour l'instant, nous vous recommandons d'utiliser BEAGLE
au lieu de PLINK pour l'analyse d'association haplotype cas/témoin. (Vous pouvez utiliser
'--recode beagle' pour exporter les données vers BEAGLE 3.3.) Nous nous excusons pour le
inconvénient, et prévoyez de développer des variantes du --heureusement... des drapeaux qui gèrent
données pré-phasées efficacement.

--distance <0-ibs>



Écrivez un tableau triangulaire inférieur délimité par des tabulations des distances génomiques (pondérées) en
unités de comptage d'allèles à {préfixe de sortie}.dist, et une liste de l'échantillon correspondant
Identifiants vers {préfixe de sortie}.dist.id. La première ligne du fichier .dist contient un seul
distance {génome 1-génome 2}, la deuxième rangée a la {génome 1-génome 3} et
{génome 2-génome 3} distances dans cet ordre, etc. * Il est généralement préférable d'effectuer
ce calcul sur un marqueur placé dans

équilibre approximatif de liaison.

* Si le modificateur 'square' ou 'square0' est présent, une matrice carrée est

écrit à la place ; 'square0' remplit le triangle supérieur droit avec des zéros.

* Si le modificateur 'gz' est présent, un fichier compressé .dist.gz est écrit

au lieu d'un fichier texte brut.

* Si le modificateur 'bin' est présent, une matrice binaire (carrée) de

les valeurs à virgule flottante double précision, adaptées au chargement à partir de R, sont à la place
écrit dans {préfixe de sortie}.dist.bin. ('bin4' spécifie des nombres en simple précision
à la place.) Cela peut être combiné avec 'square0' si vous voulez toujours le coin supérieur droit
mis à zéro, ou « triangle » si vous ne voulez pas du tout remplir le coin supérieur droit.

* Si le modificateur 'ibs' est présent, une matrice identité par état est écrite

à {préfixe de sortie}.mibs.
'1-ibs' provoque des distances exprimées en génomique

proportions (c'est-à-dire 1 - IBS) à écrire dans {préfixe de sortie}.mdist. Combiner avec
'allele-ct' si vous souhaitez également générer le fichier .dist habituel.

* Par défaut, remise à l'échelle de la distance en présence d'appels de génotype manquants

est sensible aux distributions du nombre d'allèles : si le variant A contribue, en moyenne,
deux fois plus aux autres distances par paires que la variante B, un appel manquant à la variante A
entraînera une correction d'absence deux fois plus importante. Pour désactiver cela
(parce que, par exemple, vos appels manquants ne sont pas aléatoires), utilisez le "flat-missing"
modificateur.

* Le calcul peut être subdivisé par --parallèle.

--distance-matrice

--ibs-matrice

Ces commandes obsolètes sont équivalentes à '--distance 1-ibs flat-missing square'
et '--distance ibs carré manquant plat', respectivement, sauf qu'ils génèrent
des matrices de texte délimitées par des espaces au lieu de tabulations.

--make-rel



Écrivez une matrice de relation réalisée de variance triangulaire inférieure normalisée pour
{préfixe de sortie}.rel et les identifiants correspondants à {préfixe de sortie}.rel.id. * Il est
généralement préférable d'effectuer ce calcul sur un marqueur défini dans

équilibre approximatif de liaison.

* 'square', 'square0', 'triangle', 'gz', 'bin' et 'bin4' agissent comme ils le font

on --distance.

* Le modificateur 'cov' supprime l'étape de standardisation de la variance, provoquant un

matrice de covariance à calculer à la place.

* Par défaut, les éléments diagonaux de la matrice de relations sont basés sur

--ibc's Fhat1; utilisez les modificateurs 'ibc2' ou 'ibc3' pour les baser sur Fhat2

ou Fhat3 à la place.

* Le calcul peut être subdivisé par --parallèle.

--make-grm-gz

--make-grm-bin

--make-grm-gz écrit les relations dans la liste gzippée originale de GCTA

format, qui décrit une paire par ligne, tandis que --make-grm-bin les écrit dans GCTA
Format binaire triangulaire simple précision de 1.1+. Notez que ces formats
rapportent explicitement le nombre d'observations valides (où aucun des deux échantillons n'a de
appel manquant) pour chaque paire, ce qui est une entrée utile pour certains scripts. Ces
les calculs peuvent être subdivisés avec --parallèle.

--rel-coupure {val}

(alias: --grm-coupure) Exclure un membre de chaque paire d'échantillons ayant un lien de parenté
supérieur à la valeur de coupure donnée (par défaut 0.025). Si aucune opération ultérieure ne
entraînera l'écriture de la liste des échantillons restants sur le disque, cela la sauvegardera sur
{préfixe de sortie}.rel.id. Notez que maximiser la taille de l'échantillon restant est
équivalent au problème d'ensemble indépendant maximum NP-difficile, nous utilisons donc un
algorithme au lieu de garantir l'optimalité. (Utilisez le --make-rel et mes
--garder/--supprimez les drapeaux si vous voulez essayer de faire mieux.)

--ibs-test {nombre de permutations}

--groupdist {itres} {d}

Compte tenu des données de phénotype cas/témoin, ces commandes considèrent trois sous-ensembles de la
matrice de distance : paires d'échantillons affectés, paires affectées-non affectées et paires de
échantillons non affectés. Chacun de ces sous-ensembles a une distribution de données génomiques par paires
distances ; --ibs-test utilise la permutation pour estimer les valeurs de p concernant : quels types de
les paires sont les plus similaires, tandis que --groupdist se concentre sur les différences entre les
centres de ces distributions et estimations des erreurs standard via delete-d
couteau de poche.

--régression-distance {itres} {d}

Régression linéaire des distances génomiques par paires sur des phénotypes moyens par paires et
vice versa, en utilisant delete-d jackknife pour les erreurs standard. Un phénotype scalaire est
obligatoire. * Avec moins de deux paramètres, d est défini sur {nombre de personnes}^0.6
arrondie

vers le bas.
Sans paramètres, 100 XNUMX itérations sont exécutées.

--regress-rel {itres} {d}

Régression linéaire des relations génomiques par paires sur des phénotypes moyens par paires,
et vice versa. Les valeurs par défaut pour iters et d sont les mêmes que pour --régression-distance.

--génome

Générez un rapport d'identité par filiation. * Il est généralement préférable d'effectuer cette
calcul sur un marqueur placé dans

équilibre approximatif de liaison.

* Le modificateur 'rel-check' exclut les paires d'échantillons avec des FID différents

du rapport final.

* « complet » ajoute des données brutes de comparaison par paires au rapport. * Le P(IBD=0/1/2)
estimateur employé par cette commande donne parfois

nombres en dehors de la plage [0,1] ; par défaut, ceux-ci sont tronqués.
Pour

Le modificateur 'unbounded' désactive cet écrêtage.

* Ensuite, lorsque PI_HAT^2 < P(IBD=2), 'nudge' ajuste le P(IBD=0/1/2) final

estimations à une configuration théoriquement possible.

* Le calcul peut être subdivisé par --parallèle.

--homozyg



--homozyg-snp [nombre de var min.]

--homozyg-kb [Longueur minimale]

--homozyg-densité [densité inverse max (kb/var)]

--homozyg-gap [longueur maximale de l'espace interne en Ko]

--homozyg-het [hets max]

--homozyg-window-snp [taille de la fenêtre de numérisation]

--homozyg-window-het [hets max dans la fenêtre de numérisation touché]

--homozyg-fenêtre-manquante [appels manquants max dans la fenêtre d'analyse touché]

--homozyg-window-threshold [taux de réussite de la fenêtre d'analyse min]

Ces commandes demandent un ensemble de rapports d'homozygotie et vous permettent de
personnaliser la façon dont ils sont générés. * Si vous êtes satisfait de tous les paramètres par défaut
paramètres décrits ci-dessous, il suffit

utilisé --homozyg sans modificateurs.
Dans le cas contraire, --homozyg vous permet de changer un

quelques paramètres binaires : * 'group{-verbose}' ajoute un rapport sur les pools d'exécutions qui se chevauchent
of

homozygotie.
(Défini automatiquement lorsque --homozyg-match est présent.)

* Avec 'group{-verbose}', 'consensus-match' provoque une segmentation par paires

matchs à appeler en fonction des variantes dans le segment de consensus du pool, plutôt
que les variantes dans l'intersection par paires.

* En raison du fonctionnement de l'algorithme de la fenêtre de numérisation, il est possible qu'un

ont signalé que le ROH était adjacent à quelques variants homozygotes.
Le "prolonger"

modificateur les amène à être inclus dans le ROH rapporté si cela ne provoquerait pas un
violation de la --homozyg-densité bondir.

* Par défaut, les longueurs des segments pb sont calculées comme [position de fin pb] -

[position de début de pb] + 1.
Par conséquent, les rapports diffèrent normalement légèrement

de PLINK 1.07, qui n'ajoute pas 1 à la fin.
Pour tester

fins, vous pouvez utiliser le modificateur 'subtract-1-from-lengths' pour appliquer l'ancien
formule.

* Par défaut, seules les séries d'homozygotie contenant au moins 100 variants,

et de longueur totale >= 1000 kilobases, sont notés.
Vous pouvez les modifier

minimum avec --homozyg-snp et mes --homozyg-kb, Respectivement.

* Par défaut, un ROH doit avoir au moins une variante par 50 ko en moyenne ;

changer cette borne avec --homozyg-densité.

* Par défaut, si deux variantes consécutives sont distantes de plus de 1000 ko, elles

ne peut pas être dans le même ROH ; changer cette borne avec --homozyg-gap.

* Par défaut, un ROH peut contenir un nombre illimité d'appels hétérozygotes ;

vous pouvez imposer une limite avec --homozyg-het.

* Par défaut, la fenêtre de numérisation contient 50 variantes ; changer cela avec

--homozyg-window-snp.

* Par défaut, un hit de fenêtre d'analyse peut contenir au plus 1 hétérozygote

appel et 5 appels manquants ; modifier ces limites avec --homozyg-window-het et mes
--homozyg-fenêtre-manquante, Respectivement.

* Par défaut, pour qu'une variante soit éligible à l'inclusion dans un ROH, le hit

le taux de toutes les fenêtres de numérisation contenant la variante doit être d'au moins 0.05 ; monnaie
ce seuil avec --homozyg-window-threshold.

--grappe

Échantillons en grappes utilisant une statistique de similarité par paires (normalement IBS). * Le 'cc'
le modificateur force chaque cluster à avoir au moins un cas et un

.

* Le modificateur 'group-avg' provoque l'adhésion des clusters en fonction de la moyenne

au lieu d'une similarité par paire minimale.

* Le modificateur « manquant » fait que le regroupement est basé sur

identité-par-absence au lieu d'identité-par-état, et écrit un espace délimité
matrice d'identité par absence sur le disque.

* Le modificateur 'only2' provoque uniquement un fichier .cluster2 (qui est une entrée valide

pour --dans) à écrire ; sinon 2 autres fichiers seront produits.

* Par défaut, les liens IBS ne sont pas rompus de la même manière que PLINK 1.07, donc

les solutions de cluster finales ont tendance à différer.
Ceci est généralement inoffensif.

Cependant, pour simplifier les tests, vous pouvez utiliser le modificateur 'old-tiebreaks' pour forcer
émulation de l'ancien algorithme.

--pca {compter}

Calcule une matrice de relation standardisée pour la variance (utilisez
--make-rel/--make-grm-gz/--make-grm-bin pour le vider), et extrait le top 20
composants principaux. * Il est généralement préférable d'effectuer ce calcul sur un marqueur
s'installer

équilibre approximatif de liaison.

* Vous pouvez modifier le nombre de PC en passant un paramètre numérique. * L'en-tête
le modificateur ajoute une ligne d'en-tête au fichier de sortie .eigenvec.

(Pour la compatibilité avec le drapeau GCTA du même nom, la valeur par défaut n'est pas d'en-tête
ligne.)

* Le modificateur 'tabs' fait que le(s) fichier(s) .eigenvec sont délimités par des tabulations. * Les
Le modificateur 'var-wts' demande un fichier .eigenvec.var supplémentaire avec les PC

exprimés sous forme de poids de variante au lieu de poids d'échantillon.

--Voisin [n1] [n2]

(alias: --voisin) Rapporter les distances IBS de chaque échantillon à leur n1e à
les n2èmes voisins les plus proches, les scores Z associés et les identités de ces voisins.
Utile pour la détection des valeurs aberrantes.

--assoc



--assoc

--maquette



Rapport d'analyse d'association de base. Étant donné un phénotype cas/témoin, --assoc
effectue un test allélique du chi carré 1df, tandis que --maquette effectue 4 autres tests comme
puits (1df action génique dominante, 1df action génique récessive, 2df génotypique,
tendance Cochran-Armitage). * Avec 'fisher'/'fisher-midp', le test exact de Fisher est
utilisé pour générer

valeurs p.
'fisher-midp' applique également l'ajustement mid-p de Lancaster.

* 'perm' provoque l'exécution d'un test de permutation adaptative. * 'mperm=[valeur]'
provoque un test de permutation max(T) avec le

nombre de réplications à effectuer.

* 'perm-count' fait que le rapport de test de permutation inclue les décomptes à la place

de fréquences.

* causes 'comptes' --assoc pour rapporter le nombre d'allèles au lieu des fréquences. *
« set-test » teste la signification des ensembles de variantes. Nécessite une permutation ;

peut être personnalisé avec --set-p/--set-r2/--set-max.

* 'dom', 'rec', 'gen' et 'trend' forcent le test correspondant à être utilisé

comme base pour --maquette permutation.
(Par défaut, le plus significatif

le résultat parmi les tests alléliques, dominants et récessifs est utilisé.)

* 'tendance uniquement' entraîne uniquement l'exécution du test de tendance. Étant donné un quantitatif
phénotype, --assoc effectue normalement un test de Wald. * Dans ce cas, le 'qt-means'
le modificateur provoque les moyennes et la norme du trait

les écarts stratifiés par génotype doivent également être signalés.

* 'lin' provoque le calcul de la statistique Lin et en fait la base pour

corrections de tests multiples et tests de permutation.

Plusieurs autres drapeaux (notamment, --une permanente) peut être utilisé pour personnaliser le
essai de permutation.

--mh

(alias: --cmh)

--bd

--mh2

--homog

Étant donné un phénotype cas/témoin et un ensemble de grappes, --mh calcule 2x2xK
statistiques de Cochran-Mantel-Haenszel pour chaque variante, tandis que --bd effectue également le
Test de Breslow-Day pour l'homogénéité des rapports de cotes. Test de permutation et de jeu de variantes
sur la base de la statistique CMH (par défaut) ou Breslow-Day (lorsque 'perm-bd' est présent) sont
prise en charge. Les analyses similaires suivantes sont également disponibles : * --mh2 échange le
les rôles du statut cas/témoin et de l'appartenance au cluster,

effectuer un test IxJxK de Cochran-Mantel-Haenszel stratifié phénotypiquement sur l'association
entre les affectations de grappes et les génotypes.

* --homog exécute une alternative au test de Breslow-Day, basée sur

partitionnement de la statistique du chi carré.

--gxe {indice de covariable}

Étant donné à la fois un phénotype quantitatif et une covariable cas/témoin chargée de
--covar définir deux groupes, --gxe compare le coefficient de régression dérivé de
en ne considérant que les membres d'un groupe au coefficient de régression dérivé de
ne considérant que les membres de l'autre. Par défaut, la première covariable dans le
--covar fichier définit les groupes ; utilisez par exemple '--gxe 3' pour les baser sur le troisième
covariable à la place.

--linéaire




--la logistique




Analyse d'association multi-covariable sur un quantitatif (--linéaire) ou cas/témoin
(--la logistique) phénotype. Normalement utilisé avec --covar. * 'perm' provoque normalement un
test de permutation adaptative à effectuer sur

l'effet principal, tandis que 'mperm=[value]' démarre un test de permutation max(T).

* 'perm-count' fait que le rapport de test de permutation inclue les décomptes à la place

de fréquences.

* « set-test » teste la signification des ensembles de variantes.
Nécessite une permutation ;

peut être personnalisé avec --set-p/--set-r2/--set-max.

* Le modificateur 'génotypique' ajoute un effet additif/écart de dominance 2df

test conjoint (codage 0/1/2 et 0/1/0), tandis que 'hethom' utilise le codage 0/0/1 et 0/1/0
au lieu. Si la permutation est également demandée, ces modificateurs entraînent la permutation
sur la base du test conjoint.

* 'dominant' et 'récessif' spécifient un modèle supposant une domination totale ou

récessivité, respectivement, pour l'allèle A1.

* 'no-snp' entraîne une régression uniquement sur le phénotype et le

covariables, sans référence aux données génomiques.
Si la permutation est aussi

demandé, les résultats sont rapportés pour toutes les covariables.

* 'hide-covar' supprime les lignes spécifiques à la covariable du rapport. * Par défaut, sexe
(homme = 1, femme = 0) est automatiquement ajouté en tant que

covariable sur les variants du chromosome X, et nulle part ailleurs.
Le modificateur 'sexe'

provoque son ajout partout, tandis que « no-x-sex » l'exclut.

* « interaction » ajoute des interactions génotype x covariable au modèle.
Ce

ne peut pas être utilisé avec les tests de permutation habituels ; utilisation --tests définir le
statistique de test de permutation à la place.

* 'intercept' entraîne l'inclusion des interceptions dans le rapport principal. * Pour la logistique
régressions, le modificateur 'beta' provoque une régression

coefficients au lieu des rapports de cotes à déclarer.

* Avec --linéaire, le modificateur 'standard-beta' standardise le phénotype

et tous les prédicteurs à la moyenne nulle et à la variance unitaire avant la régression.

--dosage [fichier de dosage des allèles]



--dosage [fichier de liste] liste




--écrire-dosage

Traiter (éventuellement gzippé) des fichiers texte avec des données de dosage allélique de variante majeure. Cette
ne peut pas être utilisé avec un ensemble de fichiers d'entrée standard ; à la place, vous devez *seulement* spécifier un
.fam et éventuellement un fichier .map, et vous ne pouvez spécifier aucune autre commande. * PLINK
2.0 aura un support de première classe pour les probabilités de génotype. Un

un indicateur d'importation de données équivalent sera alors fourni, et --dosage sera retiré.

* Par défaut, --dosage suppose qu'un seul fichier de dosage allélique doit être

chargé.
Pour spécifier plusieurs fichiers,

1. créer une liste principale avec une entrée par ligne.
Il y a normalement deux

formats pris en charge pour cette liste : juste un nom de fichier par ligne, ou des numéros de lot de variantes
dans la première colonne et les noms de fichiers dans la seconde.

2. Indiquez le nom de cette liste comme premier --dosage paramètre. 3. Ajoutez le
modificateur 'liste'.

* Par défaut, --dosage suppose que le ou les fichiers de dosage allélique contiennent un en-tête

ligne, qui a 'SNP' dans la colonne i+1, 'A1' dans la colonne i+j+2, 'A2' dans la colonne i+j+3,
et un échantillon de FID/IID à partir de la colonne i+j+k+4. (i/j/k sont normalement nuls, mais
peut être modifié avec 'skip0', 'skip1' et 'skip2' respectivement.) Si un tel en-tête
n'est pas présente, * lorsque tous les échantillons apparaissent dans le même ordre que dans le
fichier .fam,

vous pouvez utiliser le modiifer 'noheader'.

* Sinon, utilisez le modificateur 'sepheader' et ajoutez des exemples de noms de fichiers d'ID

à vos entrées de fichier 'liste'.

* Le modificateur 'format' vous permet de spécifier le nombre de valeurs utilisées pour

représentent chaque dose.
'format=1' indique normalement un seul 0..2 A1

nombre attendu ; 'dose1' modifie ceci à une fréquence 0..1.
'format=2'

(la valeur par défaut) indique une vraisemblance A0 homozygote 1..1 suivie d'une probabilité 0..1 het
vraisemblance, tandis que 'format=3' indique 0..1 hom A1, 0..1 het, 0..1 hom A2.

* 'Zout' fait que le fichier de sortie est compressé. * Normalement, une analyse d'association
est effectuée. « bêta standard » et

le « sexe » se comporte comme ils sont censés le faire avec --linéaire/--la logistique.
'case-control-freqs' provoque le rapport des fréquences des allèles de cas et de contrôle
séparément.

* Il existe trois modes alternatifs qui font que l'analyse d'association

être ignoré. * 'occur' demande un rapport d'occurrence de variante simple. *
--écrire-dosage provoque un simple fichier fusionné correspondant au 'format'

spécification (hors 'dose1') à générer.

* --But applique un système de notation linéaire aux dosages.

--lasso [estimation h2] {min lambda}

Estimez la taille des effets des variantes via la régression LASSO.
Vous devez fournir un

estimation de l'héritabilité additive pour calibrer la régression. Notez que cette méthode
peut nécessiter une très grande taille d'échantillon (par exemple des centaines de milliers) pour être efficace
sur des caractères polygéniques complexes.

--test manquant

Vérifier l'association entre les données manquantes et le statut cas/témoin, à l'aide de la méthode de Fisher
essai précis. Le modificateur 'midp' entraîne l'application de l'ajustement mid-p de Lancaster.

--make-perm-phéno [ct]

Générez des permutations de phénotype et écrivez-les sur le disque, sans invoquer un
épreuve d'association.

--tdt



Rapporter les statistiques du test de déséquilibre de transmission, compte tenu des phénotypes cas/témoins
et les informations généalogiques. * Un contrôle d'erreur Mendel est effectué avant le
essais; incriminé

les génotypes sont traités comme manquants par cette analyse.

* Par défaut, la valeur p TDT de base est basée sur un test du Khi deux sauf si

vous demandez le test binomial exact avec 'exact' ou 'exact-midp'.

* 'perm'/'mperm=[value]' demande un adaptatif basé sur la famille ou max(T)

essai de permutation.
Par défaut, la statistique du test de permutation est la

valeur p TDT de base ; 'parentdt1'/'parentdt2' cause parenTDT ou test combiné
les valeurs p, respectivement, doivent être considérées à la place.

* « set-test » teste la signification des ensembles de variantes.
Cela ne peut pas être utilisé

avec des tests exacts pour l'instant.

Le modificateur « poo » entraîne l'exécution d'une analyse du parent d'origine à la place, avec
transmissions de pères hétérozygotes et de mères hétérozygotes considérées
séparément. * L'analyse du parent d'origine ne prend actuellement pas en charge
essais. * Par défaut, la statistique du test de permutation est la valeur absolue

score Z du test du parent d'origine ; 'pat'/'mat' cause TDT paternel ou maternel
les statistiques du chi carré, respectivement, doivent être considérées à la place.

--qfam

--qfam-parents

--qfam-entre

--qfam-total

Test d'association basé sur la famille QFAM pour les caractères quantitatifs. * Un contrôle d'erreur Mendel
est effectué avant les tests principaux ; incriminé

les génotypes sont traités comme manquants par cette analyse.

* Cette procédure nécessite une permutation.
'perm' et 'perm-count' ont le

significations habituelles.
Cependant, 'mperm=[value]' spécifie simplement un nombre fixe

des permutations ; la méthode ne prend pas en charge un test max(T) approprié.

* Le modificateur 'emp-se' ajoute BETA et EMP_SE (erreur type empirique pour

beta) dans le fichier de sortie .perm.

--annoter [Rapport PLINK]



Ajoutez des annotations à un rapport PLINK basé sur des variantes.
Cela nécessite un

source d'annotation : * 'attrib=[fichier]' spécifie un fichier d'attributs (éventuellement compressé).
* 'ranges=[file]' spécifie un fichier de liste de gènes/plages. (Les deux types de sources peuvent être
spécifiés simultanément.) Les options suivantes sont également prises en charge : *
'filter=[fichier]' ne provoque que des variantes dans l'une des plages du fichier

à inclure dans le nouveau rapport.

* 'snps=[fichier]' fait que seules les variantes nommées dans le fichier sont incluses dans

le nouveau rapport.

* Le modificateur 'NA' fait que les variantes non annotées ont 'NA' au lieu de '.'

dans la colonne ANNOT du nouveau rapport, tandis que le modificateur 'prune' les exclut
entièrement.

* Le modificateur 'block' remplace la seule colonne ANNOT par un code 0/1

colonne pour chaque annotation possible.

* Avec 'gammes',

* 'subset=[file]' fait que seuls les intervalles nommés dans le fichier de sous-ensemble sont

chargé à partir du fichier de plages.

* les annotations d'intervalle sont normalement accompagnées d'une distance signée entre parenthèses

à la limite de l'intervalle (0 si la variante est située à l'intérieur de l'intervalle ; c'est
toujours vrai sans --frontière). Ils peuvent être exclus avec le modificateur 'minimal'.

* le modificateur 'distance' ajoute les colonnes 'DIST' et 'SGN' décrivant signé

distance à l'intervalle le plus proche.

* Lorsque --pfilter est présent, les valeurs p élevées sont filtrées.

--touffe [Nom(s) de fichier(s) du rapport PLINK...]

Rapport(s) d'analyse d'association de processus avec colonnes « SNP » et valeur p, organisation
résultats par amas basés sur LD. Plusieurs noms de fichiers peuvent être séparés par des espaces ou
virgules.

--gene-rapport [Rapport PLINK] [fichier de plage de gènes]

Générez un rapport basé sur les gènes à partir d'un rapport basé sur les variantes. * Lorsque --pfilter is
présentes, les valeurs p élevées sont filtrées. * Lorsque --extrait (sans 'plage') est
présent, seules les variantes nommées dans le

--extrait dossier sont pris en compte.

--méta-analyse [Noms de fichiers de rapport PLINK...]

--méta-analyse [Noms de fichiers de rapport PLINK...] +



Effectuer une méta-analyse sur plusieurs rapports basés sur des variantes avec « SNP » et « SE »
des champs. * Normalement, un champ de rapport de cotes « OU » doit également être présent dans chaque entrée

fichier.
Avec 'logscale', 'BETA' valeurs de cotes logarithmiques/coefficients de régression

sont attendus à la place, mais le rapport généré contiendra toujours un rapport de cotes
estimations. Avec 'qt', les valeurs d'entrée et de sortie sont des bêtas de régression.

* Les champs « CHR », « BP » et « A1 » sont également normalement requis.
causes « sans carte »

ils doivent tous être ignorés, tandis que « pas d'allèle » entraîne l'ignorance de « A1 ».

* Si les champs 'A2' sont présents et que ni 'no-map' ni 'no-allele' n'ont été

spécifié, les retournements d'allèles A1/A2 sont gérés correctement.
Sinon, A1

les décalages sont éliminés.

* « étude » entraîne la compilation d'estimations d'effets spécifiques à l'étude dans le

rapport de méta-analyse.

* 'report-all' fait que les variantes présentes dans un seul fichier d'entrée sont

inclus dans le rapport de méta-analyse.

* « weighted-z » demande des valeurs p pondérées basées sur le score Z (telles que calculées par le

logiciel METAL d'Abecasis Lab) en plus de l'habituel
une analyse. Cela nécessite P et des champs de taille d'échantillon effective.

* Lorsque --extrait (sans 'range') est présent, seules les variantes nommées dans le

--extrait dossier sont pris en compte.

* Sauf si 'no-map' est spécifié, les filtres chromosomiques sont également respectés.

--épistasie rapide



--épistasie

Recherchez les interactions épistatiques.
--épistasie rapide inspecte le joint 3x3

tables de comptage des génotypes et ne s'applique qu'aux phénotypes cas/témoins, tandis que
--épistasie effectue une régression linéaire ou logistique. * Par défaut, --épistasie rapide
utilise le test basé sur les allèles PLINK 1.07. Deux

des tests plus récents sont désormais pris en charge : « boost » invoque le test de rapport de vraisemblance introduit
par Wan X et al. (2010) BOOST : Une approche rapide pour détecter les interactions gène-gène
dans les études cas-témoins à l'échelle du génome, tandis que les « effets conjoints » appliquent l'articulation
test des effets introduit dans Ueki M, Cordell HJ (2012) Amélioration des statistiques pour
analyse des interactions à l'échelle du génome.

* L'original --épistasie rapide test applique normalement la variance et

corrections de cellules vides suggérées par l'article de Ueki et Cordell.
Pour désactiver

eux, utilisez le modificateur 'no-ueki'.

* 'case-only' demande un test case-only au lieu d'un test cas/témoin. * Par défaut,
toutes les paires de variants sur l'ensemble du génome sont testées.

Pour tester simplement des paires de variantes au sein d'un même ensemble, ajoutez le modificateur 'set-by-set'
et chargez exactement un jeu avec --ensemble/--faire-ensemble; avec exactement deux ensembles chargés, tous
les variantes d'un ensemble sont testées par rapport à toutes les variantes de l'autre. 'défini par tous'
teste plutôt toutes les variantes d'un ensemble par rapport à l'ensemble du génome.

* 'nop' supprime les valeurs p du rapport principal. * Ces calculs peuvent être
subdivisé avec --parallèle; toutefois...

--epistasis-sommaire-fusion [préfixe de fichier commun] [ct]

Quand un --{fast-}le travail d'épistasie est subdivisé avec --parallèle, le rapport principal peut être
assemblé à la fin en appliquant Unix 'cat' de la manière habituelle, mais le
Les fichiers .summary.1, .summary.2, ... peuvent nécessiter une fusion spécialisée.
--epistasis-sommaire-fusion s'occupe de ce dernier.

--deuxlocus [ID de variante] [ID de variante]

Rapport de dénombrement des génotypes conjoints à deux locus.

--But [nom de fichier] {i} {j} {k}



Appliquer un système de notation linéaire à chaque échantillon. Le fichier d'entrée doit avoir une ligne
par variante notée. Les ID de variante sont lus à partir de la colonne #i, les codes d'allèle sont lus
à partir de la colonne #j, et les scores sont lus à partir de la colonne #k, où i vaut par défaut 1, j
par défaut i+1, et k par défaut j+1. * Le modificateur 'header' provoque le premier
ligne non vide du fichier d'entrée à

Etre ignoré; autrement, --But suppose qu'il n'y a pas de ligne d'en-tête.

* Par défaut, les scores finaux sont des moyennes des scores valides par variante.

Le modificateur 'sum' provoque le rapport des sommes à la place.
(Ça ne peut pas être

utilisé avec « imputation sans moyenne ».
Et pour la compatibilité descendante, 'somme' est

automatiquement activé avec les données de dosage sauf si « pas de somme » est spécifié.)

* Par défaut, les copies de l'allèle sans nom contribuent à zéro au score, tandis que

les génotypes manquants contribuent pour un montant proportionnel à la charge (via --read-freq)
ou la fréquence allélique imputée. Éliminer les observations manquantes à la place (diminuer
le dénominateur dans la moyenne finale lorsque cela se produit), utilisez le
modificateur « pas d'imputation moyenne ».

* Alternativement, vous pouvez utiliser le modificateur 'center' pour déplacer tous les scores vers

signifie zéro.

* Cette commande peut être utilisée avec des données de dosage.
Par défaut, la colonne 'CNT'

est omis du fichier de sortie dans ce cas ; utilisez 'include-cnt' pour le conserver. Aussi,
notez que les scores sont multipliés par 0..1 doses, et non par 0..2 nombres d'allèles diploïdes,
sauf si le modificateur « double dosage » est présent.

--write-var-ranges [bloc ct]

Divisez l'ensemble des variantes en blocs de taille égale.
(Peut être utilisé avec

--snps pour répartir un travail sur plusieurs machines.)

Les autres indicateurs suivants sont pris en charge. (L'ordre des opérations est décrit à
https://www.cog-genomics.org/plink2/order .)

--scénario [fname] : Inclut les options de ligne de commande du fichier.

--rediffusion {Journal}
: réexécutez les commandes dans le journal (par défaut 'plink.log').

--version
: Afficher uniquement le numéro de version avant de quitter.

--silencieux
: Supprimer la sortie vers la console.

--gplink
: Réservé à l'interopérabilité avec gPLINK.

--génotype-manquant [char] : Définit le code de génotype manquant (normalement '0').

--double-identifiant
: définissez à la fois les FID et les IID sur l'ID d'échantillon VCF/BCF.

--const-fid {IDENTIFIANT}
: définissez tous les FID sur la constante donnée (par défaut '0').

--id-delim {ré}
: analyse les ID d'échantillon en tant que [FID][d][IID] (délimitation par défaut '_').

--vcf-idspace-vers [c] : convertit les espaces dans les ID d'échantillon en le caractère donné.

--biallélique-seulement : Ignorer les variantes VCF avec 2+ alt. allèles.

--vcf-min-qual [val]
: Ignorez les variantes VCF avec QUAL faible/manquant.

--vcf-filtre {exceptions)...}
: ignore les variantes qui ont des échecs de FILTRE.

--vcf-require-gt
: ignore les variantes sans champ GT.

--vcf-min-gq [val]
: No-call un génotype lorsque GQ est en dessous du seuil donné.

--vcf-min-gp [val]
: Non-appel d'un génotype lorsque le GP à l'échelle 0-1 est inférieur au seuil donné.

--vcf-demi-appel [M]
: spécifiez comment '0/.' et des valeurs VCF GT similaires doivent être traitées. Ce qui suit
trois modes sont pris en charge : * 'error'/'e' (par défaut) erreurs et rapports ligne #.
* 'haploïde'/'h' les traite comme des appels haploïdes. * 'manquant'/'m' les traite comme
manquant.

--oxford-single-chr [chr nm] : spécifiez le fichier .gen à un seul chromosome avec
première colonne ignorable.

--oxford-pheno-name [col nm] : Importez le phénotype nommé depuis le fichier .sample.

--seuil-d'appel-dur [val]
: lorsqu'un ensemble de fichiers au format Oxford est chargé, les appels

--seuil-d'appel-dur aléatoire
avec un niveau d'incertitude supérieur à 0.1 sont normalement traités comme manquants. Vous pouvez
ajustez ce seuil en fournissant un paramètre numérique, ou randomisez tous les appels avec
'Aléatoire'.

--code-manquant {string list} : liste délimitée par des virgules des phénotypes manquants

(alias: --code_manquant)
valeurs pour les ensembles de fichiers au format Oxford (déf. 'NA').

--simulate-ncases [sur une]
: Ensemble --simuler nombre de cas (par défaut 1000).

--simulate-ncontrols [n]
: Ensemble --simuler nombre de contrôles (par défaut 1000).

--simuler-prévalence [p] : Définir --simuler prévalence de la maladie (par défaut 0.01).

--simuler-n [sur une]
: Ensemble --simuler-qt nombre d'échantillons (par défaut 1000).

--simuler-étiquette [préfixe] : Définir --simuler{-qt} Préfixe du nom FID/IID.

--simuler-manquant [freq] : Définir --simuler{-qt} fréquence de génotype manquante.

--allow-extra-chr
: Autoriser les codes chromosomiques non reconnus. Le '0'

(alias: --aec)
le modificateur les fait traiter comme s'ils avaient été mis à zéro.

--chr-ensemble [ct autosome] :

Spécifiez un jeu de chromosomes non humains.
Le premier paramètre définit le nombre de

paires d'autosomes diploïdes si positifs, ou chromosomes haploïdes si négatifs. Étant donné
autosomes diploïdes, les modificateurs restants indiquent l'absence du nom
chromosomes non autosomiques.

--vache/--chien/--cheval/--souris/--riz/--mouton : Raccourcis pour ces espèces.

--autosome-num [valeur]
: Alias ​​pour '--chr-set [valeur] no-y no-xy no-mt'.

--cm-carte [fname pattern] {chr} : utilisez les cartes de recombinaison au format SHAPEIT pour définir
positions centimorgan. Pour traiter plus d'un chromosome, incluez un '@' dans le
premier paramètre où le chrom. nombre appartient, par exemple
'carte_génétique_chr@_combined_b37.txt'.

--zéro-cms
: Zéro sur les positions centimorgan.

--phéno [fnom]
: charge les données de phénotype à partir du fichier spécifié, au lieu d'utiliser les valeurs dans le
ensemble de fichiers d'entrée principal.

--tout-phéno
: Pour les tests d'association de base, parcourez tous les phénotypes dans --phéno fichier.

--mphéno [n]
: Charger le phénotype de la colonne (n+2) dans --phéno fichier.

--pheno-nom [c] : Si --phéno fichier a une ligne d'en-tête, utilisez la colonne avec le
prénom.

--phéno-fusion
: Lorsque le fichier d'entrée principal contient une valeur de phénotype pour un échantillon, mais que
--phéno fichier ne le fait pas, utilisez la valeur d'origine au lieu de traiter le phénotype comme
manquant.

--missing-phénotype [v] : Définir la valeur de phénotype manquante (normalement -9).

--1 : Attendez-vous à ce que les phénotypes cas/contrôle soient codés comme 0 = contrôle, 1 = cas, au lieu de
l'habituel 0 = manquant, 1 = témoin, 2 = cas.

--make-phéno [fn] [val] : Définir un nouveau phénotype cas/témoin.
Si le paramètre val est '*', tous les échantillons listés dans le fichier donné sont des cas, et
tout le monde est un contrôle. (Notez que, dans certaines coques, il est nécessaire de
entourez le * de guillemets.) Sinon, tous les échantillons avec la troisième entrée de colonne sont égaux
au paramètre val sont des cas, et tous les autres échantillons mentionnés dans le fichier sont
les contrôles.

--queue-phéno [Lt] {Hbt} : Downcoder un phénotype scalaire en cas/témoin
phénotype. Tous les échantillons avec des valeurs de phénotype supérieures à Hbt sont des cas, et tous
avec des valeurs inférieures ou égales à Lt sont des témoins. Si Hbt n'est pas spécifié, il est
égal à Lt; sinon, les valeurs de phénotype intermédiaires sont définies sur manquantes.

--covar [nom de fichier] : Spécifiez le fichier de covariables.

--covar-nom [...]
: Spécifiez la ou les covariables dans --covar fichier par nom. Séparez plusieurs noms avec
des espaces ou des virgules, et utilisez des tirets pour désigner les plages.

--covar-nombre [...]
: Spécifiez la ou les covariables dans --covar fichier par index.

--no-const-covar
: Exclure les covariables constantes.

--dans [F]
: spécifiez les affectations de cluster initiales.

--mdans [n]
 : Charger les affectations de cluster à partir de la colonne n+2.

--famille
: créez un cluster pour chaque ID de famille.

--loop-assoc [F]
: Exécutez les commandes d'association cas/témoin spécifiées une fois pour chaque cluster du
fichier, en utilisant l'appartenance au cluster comme phénotype.

--ensemble [nom de fichier]
: Charger des ensembles à partir d'un fichier .set.

--set-names [des noms)...]
: charge uniquement les ensembles nommés sur la ligne de commande. Utilisez des espaces pour séparer plusieurs noms.

--sous-ensemble [nom de fichier]
: charge uniquement les ensembles nommés dans le fichier texte donné.

--set-collapse-all [nom de l'ensemble] : fusionne tous les ensembles.

--complement-ensembles
: inverser tous les ensembles. (Les noms gagnent les préfixes 'C_'.)

--make-set-complement-all [s] : --set-collapse-all + renversement.

--make-set [nom de fichier]
: Définissez des ensembles à partir d'une liste de plages de bp nommées.

--make-set-border [ko]
: Étirer les régions dans --make-set fichier.

--make-set-collapse-group
: Définissez des ensembles à partir de groupes au lieu d'ensembles dans --make-set fichier.

--garder [nom de fichier]
: Exclure tous les échantillons non nommés dans le fichier.

--supprimer [nom de fichier]
: Exclure tous les échantillons nommés dans le fichier.

--keep-fam [filename] : exclut toutes les familles non nommées dans le fichier.

--remove-fam [fnom]
: Exclure toutes les familles nommées dans le fichier.

--extrait [f] : Exclure toutes les variantes non nommées dans le fichier.

--exclure [f] : Exclure toutes les variantes nommées dans le fichier.

--keep-clusters [nom de fichier]
: Ceux-ci peuvent être utilisés individuellement ou en

--keep-cluster-names [des noms)...]
combinaison pour définir une liste de clusters à conserver ; tous les échantillons ne faisant pas partie d'un cluster
cette liste est alors exclue. Utilisez des espaces pour séparer les noms de cluster pour
--keep-cluster-names.

--remove-clusters [nom de fichier]
: Exclure tous les clusters nommés dans le fichier.

--remove-cluster-names [nom(s)...] : exclut les clusters nommés.

--gène [sets...] : exclut les variantes qui ne se trouvent pas dans un ensemble nommé sur la ligne de commande.
(Séparez plusieurs noms d'ensembles par des espaces.)

--gène-tout
: Exclure les variantes qui ne font partie d'aucun ensemble. (PLINK 1.07 faisait automatiquement
ceci dans certaines circonstances.)

--attribut [f] {att lst} : Soit un fichier attribuant des attributs aux variants, et un

--attrib-indiv [FA}
liste délimitée par des virgules (sans espace) des noms d'attributs, supprimer
variantes/échantillons qui sont absents du fichier ou qui n'ont aucun des
attributs répertoriés. Si certains noms d'attributs de la liste sont précédés de '-', ils
sont plutôt traitées comme des "conditions de correspondance négatives" : les variantes avec au moins une
l'attribut de correspondance négatif est supprimé. Le premier caractère de la liste ne peut pas être un
'-', en raison du fonctionnement de l'analyse de la ligne de commande ; ajouter une virgule devant pour se déplacer
ce.

--chr [chrs...]
: Exclure tous les variants non présents sur le(s) chromosome(s) donné(s). Des choix valables pour les humains
sont 0 (non placé), 1-22, X, Y, XY et MT. Séparez plusieurs chromosomes avec
des espaces et/ou des virgules, et utilisez un tiret (aucun espace adjacent n'est autorisé) pour indiquer un
plage, par exemple '--chr 1-4, 22, xy'.

--pas-chr [...]
: Inverse de --chr (exclure les variantes sur les chromosomes répertoriés).

--autosome
: Exclure tous les variants non autosomiques.

--autosome-xy
: Exclure tous les variants non autosomiques, sauf ceux avec le code chromosomique XY
(région pseudo-autosomique de X).

--snps-uniquement : Exclure les variantes avec des codes allèles à plusieurs caractères.

--de [ID de la variable]
 : Utilisez des ID pour spécifier une plage de variantes à charger. Lorsqu'ils sont utilisés

--à [var ID] ensemble, les deux variantes doivent être sur le même chromosome.

--snp [var ID] : spécifiez une seule variante à charger.

--exclure-snp [] : spécifiez une seule variante à exclure.

--la fenêtre
[kbs] : Avec --snp or --exclure-snp, charge/exclut toutes les variantes dans la moitié de la
distance kb spécifiée de celui nommé.

--de-pb [pos]
: Utilisez la ou les position(s) physique(s) pour définir une plage de variantes à

--to-pb
[pos] charge. --à partir de Ko/--to-kb/--from-mb/--to-mb autoriser la décimale

--à partir de Ko [pos]
valeurs. Vous devez également spécifier un seul chromosome (en utilisant

--en Ko
[pos] par exemple --chr) lors de l'utilisation de ces drapeaux.

--from-mb [pos]

--tombeau
[pos]

--snps [ID de variables...]
 : utilisez des ID pour spécifier la ou les plages de variantes à charger ou

--exclude-snps [...]
exclure. Par exemple, '--snps rs1111-rs2222, rs3333, rs4444'.

--mince [p]
 : Supprimer au hasard des variantes, en conservant chacune avec prob. p.

--mince-compte [n] : Supprimez aléatoirement des variantes jusqu'à ce qu'il n'en reste plus.

--bp-espace [bps] : Supprimez les variantes afin que chaque paire ne soit pas plus proche que la
distance pb donnée. (Équivalent à VCFtools --mince.)

--mince-indiv [p]
: Retirer au hasard des échantillons, en conservant avec prob. p.

--thin-indiv-count [n]
: Retirez aléatoirement des échantillons jusqu'à ce qu'il n'en reste plus.

--filtre [f] [val(s)...] : Exclut tous les échantillons sans entrée de 3ème colonne dans
le fichier donné correspondant à l'une des valeurs séparées par des espaces données.

--mfiltre [n]
: Match contre la (n+2)ème colonne à la place.

--géno {val}
: Exclure les variantes avec des fréquences d'appels manquantes supérieures à un seuil (par défaut
0.1). (Notez que le seuil par défaut n'est appliqué que si --géno est invoqué
sans paramètre ; lorsque --géno n'est pas invoqué, aucun appel manquant par variante
le plafond de fréquence n'est pas du tout appliqué. Autres seuils d'inclusion/exclusion par défaut
fonctionne de la même manière.)

--dérange {val}
: Exclure les échantillons avec des fréquences d'appels manquantes supérieures à un seuil (par défaut
0.1).

--obligatoire-manquant [f1] [f2] : Spécifiez les blocs d'appels de génotype manquants pour
--géno/--l'esprit d'ignorer. Le premier fichier doit avoir des ID de variante dans le premier
ID de colonne et de bloc dans le second, tandis que le second fichier doit avoir des FID dans le
première colonne, les IID dans la seconde et les ID de bloc dans la troisième.

--prune
: Supprimer les échantillons avec des phénotypes manquants.

--maf {fréq}
: Exclure les variants dont la fréquence des allèles mineurs est inférieure à un seuil (par défaut
0.01).

--max-maf [fréq]
: Exclure les variantes avec MAF supérieur au seuil.

--Mac [ct]
: Exclure les variants dont le nombre d'allèles mineurs est inférieur au

(alias: --min-ac)
seuil donné.

--max-mac [ct]
: Exclure les variants dont le nombre d'allèles mineurs est supérieur à

(alias: --max-ac)
le seuil donné.

--maf-succ
: Règle de succession Estimation MAF (utilisée dans EIGENSOFT). Étant donné j observations de
un allèle et k >= j observations de l'autre, en déduire un MAF de (j+1) / (j+k+2),
plutôt que la valeur par défaut j / (j+k).

--read-freq [fn] : Estimer les MAF et les fréquences hétérozygotes à partir des
--fréqrapport {x}, au lieu de l'ensemble de fichiers d'entrée.

--hwe [p] : Exclure les variantes avec Hardy-Weinberg
test exact d'équilibre p-valeurs inférieures à un seuil.

--moi [la télé] : Filtrez les trios et les variantes avec l'erreur de Mendel
taux dépassant les seuils donnés.

--me-exclure-un {rapport} : Faire --moi exclure un seul échantillon par trio.

--scores qualitatifs [f] {qcol} {IDcol} {skip} : filtre les variantes avec
scores de qualité hors plage. La plage par défaut est maintenant [0, \infty ).

--qual-seuil [score min de qual]
: Ensemble --scores qualitatifs étage de gamme.

--qual-max-seuil [score max qual]
: Ensemble --scores qualitatifs plafond de gamme.

--allow-no-sexe
: Ne traitez pas les échantillons de sexe ambigu comme ayant des phénotypes manquants dans l'analyse
commandes. (Automatique /w --pas de sexe.)

--must-have-sexe
: forcer les phénotypes de sexe ambigu à manquer sur
--faire son lit/--make-just-fam/--recode/--write-covar.

--filtres-cas
: n'inclut que les observations dans l'analyse en cours.

--filter-contrôles
: inclure uniquement les contrôles.

--filter-hommes
: N'inclure que les hommes.

--filter-femmes
: Inclure uniquement les femmes.

--filter-fondateurs
: n'inclut que les fondateurs.

--filter-nonfondateurs : inclure uniquement les non-fondateurs.

--nonfondateurs
: Inclure les non-fondateurs dans les calculs allele freq/HWE.

--make-fondateurs : Effacer les identifiants parentaux pour ceux
avec 1+ parent(s) manquant(s).

--recode-allèle [fn] : Avec --recoder A/A-transpose/AD, compter les allèles nommés dans
le fichier (sinon les allèles A1 sont toujours comptés).

--sortie-chr [Code MT] : définissez le schéma de codage des chromosomes dans les fichiers de sortie en
fournissant le code mitochondrial humain souhaité. (Les options sont '26', 'M', 'MT',
'0M', 'chr26', 'chrM' et 'chrMT'.)

--output-missing-génotype [ch] : Définit le code utilisé pour représenter les manquants
génotypes dans les fichiers de sortie (normalement --génotype-manquant valeur).

--sortie-phénotype-manquant [s] : définit la chaîne utilisée pour représenter les éléments manquants
phénotypes dans les fichiers de sortie (normalement le --missing-phénotype valeur).

--zéro-cluster [f] : En combinaison avec --dans/--famille, définir des blocs de
appels de génotype à manquant. Le fichier d'entrée doit avoir des ID de variante dans le premier
ID de colonne et de cluster dans le second. Ceci doit maintenant être utilisé avec --faire son lit et non
autres commandes de sortie.

--set-hh-manquant : Causer --faire son lit et mes --recoder définir un haploïde hétérozygote
génotypes manquants.

--split-x [bp1] [bp2] : Modifie le code chromosomique de tous les chromosomes X

--split-x [construire]
variants avec position bp <= bp1 ou >= bp2 à XY. Les codes de construction suivants sont
pris en charge en tant que raccourci : * 'b36'/'hg18' = NCBI 36, 2709521/154584237 * 'b37'/'hg19'
= GRCh37, 2699520/154931044 * 'b38'/'hg38' = GRCh38, 2781479/155701383 Par défaut,
Erreurs PLINK lorsqu'aucune variante ne serait affectée par --split-x; le "sans échec"
modificateur (utile dans les scripts) remplace ceci.

--merge-x
: Fusionner le chromosome XY avec X.

--set-me-manquant
: Causer --faire son lit pour définir les erreurs de Mendel sur manquantes.

--fill-missing-a2 : Causer --faire son lit pour remplacer tous les appels manquants par
cris A2 homozygotes.

--set-missing-var-ids [t]
: Étant donné une chaîne de modèle avec un '@' où le code du chromosome doit aller et '#'
où appartient la coordonnée bp, --set-missing-var-ids assigne
ID basés sur les chromosomes et les bp à des variants sans nom. Vous pouvez également utiliser '$1' et '$2' pour
faire référence aux noms d'allèles dans la chaîne de modèle, et en fait cela devient essentiel
lorsque plusieurs variantes partagent la même coordonnée.

--new-id-max-allele-len [n] : Spécifiez le nombre maximum de caractères de début
des noms d'allèles à inclure dans les nouveaux identifiants de variantes (23 par défaut).

--code-var-manquant [string] : Changer le code de variante sans nom (par défaut '.').

--update-chr
[f] {chrcol} {IDcol} {skip} : Mettre à jour les codes des chromosomes variants.

--update-cm
[f] {cmcol} {IDcol} {skip} : Mise à jour des positions centimorgan.

--update-carte
[f] {bpcol} {IDcol} {skip} : Mettre à jour les positions des points de base des variantes.

--nom-mise-à-jour [f] {newcol} {oldcol} {skip} : Mettre à jour les identifiants des variantes.

--update-allèles [fname] : mettre à jour les codes d'allèles des variantes.

--allèle1234 : Interpréter/recoder les allèles A/C/G/T comme 1/2/3/4.
Avec 'multichar', convertit tous les A/C/G/T dans les noms d'allèles en 1/2/3/4s.

--allèleACGT : Inverse de --allèle1234.

--update-ids [f]
: Mettre à jour les ID d'échantillon.

--update-parents [f] : Mettre à jour les identifiants parentaux.

--update-sexe [f] {n} : Mettre à jour les sexes.
Le sexe (1 ou M = masculin, 2 ou F = féminin, 0 = manquant) est chargé à partir de la colonne n+2
(n par défaut est 1).

--retourner [nom de fichier]
: Retourner les allèles (A<->T, C<->G) pour les ID SNP dans le fichier.

--flip-sous-ensemble [fn]
: Appliquer uniquement --retourner aux échantillons dans --flip-sous-ensemble fichier.

--flip-scan-window [ct+1] : Définir --flip-scan max variante ct dist. (déf. 10).

--flip-scan-window-ko [x] : définir --flip-scan distance maximale en kb (par défaut 1000).

--flip-scan-seuil [x] : définir --flip-scan corrélation minimale (0.5 par défaut).

--garder l'ordre des allèles
: Conserver l'ordre des allèles défini dans le fichier .bim,

--real-ref-allèles
au lieu de forcer A2 à être l'allèle majeur. --real-ref-allèles supprime également 'PR'
à partir des valeurs INFO émises par --recoder vcf{-fid/-iid}.

--a1-allèle [f] {a1col} {IDcol} {skip} : Force les allèles du fichier à A1.

--a2-allèle [nom de fichier] {a2col} {IDcol} {skip} :

Forcer les allèles du fichier à A2.
("--a2-allèle [nom du fichier VCF] 4 3 '#'",

qui extrait les affectations d'allèles de référence d'un fichier VCF, est particulièrement utile.)

--tri-indiv [m] {f} : spécifiez l'ordre de tri FID/IID.
Les quatre modes suivants sont pris en charge : * 'none'/'0' conserve les échantillons dans l'ordre
ils étaient

chargé.
Valeur par défaut pour les opérations sans fusion.

* 'naturel'/'n' appelle 'tri naturel', par exemple
'id2' < 'ID3' < 'id10'. Par défaut lors de la fusion.

* 'ascii'/'a' trie dans l'ordre ASCII, par exemple
'ID3' < 'id10' < 'id2'.

* 'file'/'f' utilise l'ordre dans le fichier donné (nommé
dans le deuxième paramètre).

Pour l'instant, seulement --fusionner/--bmerge/--merge-list et
--faire son lit/--make-just-fam respecte ce drapeau.

--with-phénotype : Inclure plus d'informations sur l'échantillon
dans le nouveau fichier .cov.

--codage factice {N} : Diviser les variables catégorielles (n catégories,
2 < n <= N, N par défaut est 49) en n-1 variables fictives binaires lors de l'écriture de la covariable
fichier.

--mode-fusion [n]
: Régler --{b}comportement de fusion/--fusion-liste basé sur un code numérique. 1 (par défaut) =
ignorer les appels manquants, sinon la différence

-> manquant
2 = écraser uniquement les appels manquants à l'origine 3 = écraser uniquement lorsqu'ils ne manquent pas dans
nouveau fichier 4/5 = ne jamais écraser et toujours écraser, respectivement 6 = signaler tout
appels incompatibles sans fusion 7 = signaler les appels non manquants incompatibles sans
fusion

--merge-equal-pos
: Avec --fusionner/--bmerge/--merge-list, fusionne des variantes avec des noms différents mais
postes identiques. (Exception : les variantes du code chromosomique 0 à la même position ne sont pas
fusionné.)

--mendel-duos
 : Faites en sorte que les vérifications d'erreurs de Mendel prennent en compte les échantillons avec un seul parent dans l'ensemble de données.

--mendel-multigen
: Faire en sorte que les vérifications d'erreurs de Mendel prennent en compte les génotypes des (arrière-)grands-parents
les données de génotype sont manquantes.

--ld-fenêtre [ct+1] : Définir --r/--r2 max variante ct distance par paire (usu. 10).

--ld-window-ko [x] : définir --r/--r2 max kb distance par paire (généralement 1000).

--ld-window-r2 [x] : Définir le seuil pour --r2 rapporter l'inclusion (habituellement 0.2).

--ld-snp [ID de la variable]
: Définissez la première variante dans tous --r/--r2 paires.

--ld-snps [vID...] : restreindre d'abord --r/--r2 variante aux gammes données.

--ld-snp-liste [f]
: Restreindre d'abord --r/--r2 var. à ceux nommés dans le dossier.

--tout lister
: Génère le rapport du mode 'tous' lors de l'utilisation --Voir les étiquettes en mode fichier.

--tag-ko [ko]
: Ensemble --Voir les étiquettes distance maximale de l'étiquette en ko (par défaut 250).

--tag-r2 [val]
: Ensemble --Voir les étiquettes balise min r-carré (par défaut 0.8)

--tag-mode2
: Utiliser deux colonnes --Voir les étiquettes (mode fichier) Format d'E/S.

--ld-xchr [Code]
: Définir le modèle Xchr pour --indépendant{-par paire}, --r/--r2, --flip-scan et --Voir les étiquettes. 1/XNUMX/XNUMX
(par défaut) = mâles codés 0/1, femelles 0/1/2 (dosage A1) 2 = mâles codés 0/2 3 =
les hommes codés 0/2, mais les femmes reçoivent une double pondération

--blocks-max-ko [ko]
: Ensemble --blocs durée maximale d'haplobloc (déf. 200).

--blocks-min-maf [couper]
: Régler --blocs MAF minimum (par défaut 0.05).

--blocks-strong-lowci [X]
: Ensemble --blocs Seuils CI 'fort LD' (valeurs par défaut

--blocks-strong-highci [X]
0.70 et 0.98).

--blocks-recomb-highci [x] : Définit le seuil CI de « recombinaison » (0.90 par défaut).

--blocks-inform-frac [X]
: Forcer les ratios haploblocs [paires LD fortes] : [paires informatives totales] à être plus grands
supérieure à cette valeur (0.95 par défaut).

--distance-poids exp=[x]
: Lors du calcul des distances génomiques, attribuez à chaque variant un poids de (2q(1-q))^{-x},
où q est le MAF chargé ou déduit.

--read-dists [dist file] {id file} : charge une matrice de distance binaire triangulaire
au lieu de recalculer à partir de zéro.

--ppc-écart [val]
: Nombre minimal de paires de bases, en milliers, entre paires informatives de marqueurs
utilisé dans --génome Test CPP. 500 si non spécifié.

--min [couper]
: Spécifiez le PI_HAT minimum à inclure dans --génome signaler.

--maximum [couper]
: Spécifiez le maximum de PI_HAT à inclure dans --génome signaler.

--homozyg-match [] : Définir la concordance minimale entre les homozygotes conjoints
variantes pour une correspondance allélique par paire à déclarer.

--pool-taille [ct]
: Définissez la taille minimale des pools dans le rapport '--homozyg group'.

--read-génome [fn] : Charger --génome rapport pour --grappe/--voisin, à la place
de recalculer les valeurs p des tests IBS et PPC à partir de zéro.

--ppc [p-val]
: spécifiez la valeur p minimale du test PPC dans un cluster.

--mc [taille max]
: spécifiez la taille de cluster maximale.

--mcc [c1] [c2]
: spécifiez le nombre maximal de cas et de témoins par cluster.

--K [compte min.]
: spécifiez le nombre minimum de clusters.

--ibm [val]
: spécifiez le minimum d'identité par absence.

--rencontre [f] {mv} : utilisez des valeurs de covariable pour restreindre le regroupement.
Sans --Type de match, deux échantillons ne peuvent être dans le même cluster que si toutes les covariables
correspondre. Le deuxième paramètre facultatif spécifie une valeur de covariable à traiter comme
manquant.

--Type de match [f] : Affiner l'interprétation de --rencontre fichier.
Pour --Type de match le fichier doit être une seule ligne avec autant d'entrées que le
--rencontre le fichier a des covariables ; Les entrées '0' spécifient des 'correspondances négatives' (c'est-à-dire des échantillons
avec des valeurs de covariable égales ne peuvent pas être dans le même groupe), les entrées '1' spécifient
'correspondances positives' (par défaut) et '-1' entraîne la covariable correspondante
ignoré.

--qmatch [f] {m} : force tous les membres d'un cluster à avoir des

--qt [fnom]
valeurs des covariables quantitatives. le --qmatch le fichier contient les valeurs des covariables,
tandis que le --qt le fichier est une liste de tolérances non négatives (et le marquage '-1'
covariables à ignorer).

--pca-cluster-names [...] : Ceux-ci peuvent être utilisés individuellement ou en combinaison

--pca-clusters [fnom]
pour définir une liste de clusters à utiliser dans le basic --pca calcul.
(--pca-cluster-names attend une séquence de noms de cluster délimités par des espaces, tandis que
--pca-clusters attend un fichier avec un nom de cluster par ligne.) Tous les échantillons en dehors
ces clusters seront ensuite projetés sur les PC calculés.

--mds-intrigue [estompé] :

Analyse de mise à l'échelle multidimensionnelle.
Nécessite --grappe.

--cellule [battre]
: Sauter certains --maquette teste lorsqu'une entrée du tableau de contingence est inférieure à la donnée
seuil.

--état [ID de la variable] : Ajoutez une variante en tant que --linéaire
or --la logistique covariable.

--condition-liste [F] : Ajouter les variantes nommées dans le fichier
as --linéaire/--couvertures logistiques.

--paramètres [...]
: inclure uniquement les covariables/interactions données dans --linéaire/--modèles logistiques,
identifié par une liste d'indices de base 1 et/ou des plages de ceux-ci.

--tests {...} : Effectue un test (conjoint) sur le(s) terme(s) spécifié(s) dans le
--linéaire/--modèle logistique, identifié par des indices de base 1 et/ou des plages de ceux-ci. Si
permutation a été demandée, elle est basée sur ce test. * Notez que, lorsque
--paramètres est également présent, le

les indices font référence aux termes restant APRÈS l'élagage par
--paramètres.

* Vous pouvez utiliser '--tests all' pour inclure tous les termes.

--vif [VIF max]
: Définir le seuil VIF pour --linéaire contrôle de multicolinéarité (par défaut 50).

--xchr-modèle [code] : Définir le chromosome X --linéaire/--modèle logistique.
0 = sauter le sexe et les chromosomes haploïdes 1 (par défaut) = ajouter le sexe comme covariable sur X
chromosome 2 = code génotypes mâles 0/2 au lieu de 0/1 3 = test d'interaction
entre génotype et sexe

--lasso-select-covars {cov(s)...} : soumettre certaines ou toutes les covariables à LASSO
sélection du modèle.

--régler
: Signalez quelques corrections de tests multiples.

--lambda [val]
: Définir lambda de contrôle génomique pour --régler.

--ci [Taille]
: rapporte les intervalles de confiance pour les rapports de cotes.

--pfilter [val]
: Filtrez les résultats des tests d'association avec des valeurs de p plus élevées.

--une permanente [min perms - 1] {max perms} {alpha} {beta} {init interval} {slope} :

Configurez jusqu'à six paramètres contrôlant les tests de permutation adaptative. * Les deux premiers
contrôler le nombre minimum et maximum de permutations qui

peut être exécuté pour chaque variante ; les valeurs par défaut sont 5 et 1000000.

* Les deux suivants contrôlent la condition de résiliation anticipée.
A

Un intervalle de confiance de 100 % * (1 - bêta/2T) est calculé pour chaque valeur de p empirique,
où T est le nombre total de variantes ; chaque fois que cet intervalle de confiance n'est pas
contiennent alpha, la variante est exemptée de tests de permutation supplémentaires. Défaut
les valeurs sont 0 et 1e-4.

* Les deux derniers contrôlent lorsque la condition de résiliation anticipée est vérifiée.
If

une vérification se produit à la permutation #p, la vérification suivante se produit après [pente]p + [init
intervalle] plusieurs permutations (arrondies à l'inférieur). L'intervalle initial par défaut est 1, et
la pente par défaut est de 0.001.

--mperm-save
: Enregistrer les meilleures statistiques de test de permutation max(T).

--mperm-sauver-tout : Enregistrer toutes les statistiques de test de permutation max(T).

--set-p [p-val]
: Ajuster le plafond de la valeur p de la variante significative du test défini (0.05 par défaut).

--set-r2 {v}
: Ajuster le plafond de la variante significative du test de l'ensemble r^2 par paires (0.5 par défaut). 'écrivez'
provoque le vidage des paires en infraction dans {output prefix}.ldset.

--set-max [ct]
 : Ajustez le nombre maximal de tests d'ensemble de variantes significatives considérées par ensemble (5 par défaut).

--set-test-lambda [v] : Spécifiez la correction du contrôle génomique pour le test défini.

--frontière [ko]
: Se déployer --annoter intervalles de plage par # kbs donnés.

--annoter-champ-snp [nm] : Définir --annoter nom du champ d'ID de variante.

--clump-p1 [pval] : définir --touffe indice var. plafond de la valeur p (par défaut 1e-4).

--clump-p2 [pval] : définir --touffe seuil de valeur p secondaire (0.01 par défaut).

--clump-r2 [r^2]
: Ensemble --touffe Seuil r^2 (0.5 par défaut).

--clump-ko [ko]
: Ensemble --touffe rayon ko (par défaut 250).

--clump-snp-champ [n...]
: Ensemble --touffe nom du champ d'ID de variante ('SNP' par défaut). Avec plusieurs noms de champs,
les anciens noms priment sur les suivants.

--clump-champ [Nom...]
: Ensemble --touffe Nom du champ de valeur p (par défaut 'P').

--clump-allow-overlap
: Laisser --touffe variables non indexées. joindre plusieurs touffes.

--clump-verbeux
: Demande étendue --touffe signaler.

--clump-annoter [hdr...] : Inclut des champs supplémentaires nommés dans --clump-verbeux et mes
--clump-meilleur rapports. (Les noms de champs peuvent être séparés par des espaces ou des virgules.)

--clump-gamme [nom de fichier]
: signale les chevauchements entre les blocs et les régions.

--clump-range-border [kb] : Étirer les régions dans --clump-gamme fichier.

--clump-index-premier
: Extrait --touffe variables d'index. à partir du seul premier fichier.

--clump-réplique
: Exclure les groupes contenant des résultats secondaires d'un seul fichier.

--clump-meilleur
: Indiquez le meilleur proxy pour chaque --touffe indice var.

--méta-analyse-snp-field [n...] : Définir --méta-analyse ID de variante, A1/A2

--méta-analyse-a1-champ [n...]
allèle, valeur p et/ou échantillon efficace

--méta-analyse-a2-champ [n...]
noms de champs de taille. Les valeurs par défaut sont 'SNP',

--méta-analyse-p-field [n...]
'A1', 'A2', 'P' et 'NMISS',

--méta-analyse-ess-field [n...]
respectivement. Lorsque plusieurs paramètres sont donnés à ces drapeaux, les noms antérieurs
prévalent sur les suivantes. A noter que si le nombre de cas et de témoins
sont inégaux, la taille effective de l'échantillon doit être

4 / (1/[# cas] + 1/[# témoins]).

--meta-analysis-report-dups
: Lorsqu'une variante apparaît plusieurs fois dans le même fichier, signalez-le.

--gene-list-border [ko]
: Se déployer --gene-rapport régions par # donné de kbs.

--gene-sous-ensemble [nom de fichier]
: Spécifiez le sous-ensemble de nom de gène pour --gene-rapport.

--gene-report-snp-champ [] : Régler --gene-rapport nom du champ d'ID de variante (par défaut
'SNP'). Pertinent uniquement avec --extrait.

--écart [ko]
: Définissez '--fast-epistasis case-only' min. espace (par défaut 1000).

--epi1 [valeur p] : Définir --{fast-}seuil de signalement d'épistasie (par défaut
5e-6 pour 'booster', 1e-4 sinon).

--epi2 [p-value] : définit le seuil de contribution au comptage SIG_E (déf. 0.01).

--je-cellmin [n] : Définir le nombre requis d'observations par contingence 3x3x2
cellule du tableau pour le test des effets conjoints (5 par défaut).

--q-score-plage [fichier de plage] [fichier de données] {i} {j} :

Appliquer --But au(x) sous-ensemble(s) de variantes dans la liste de scores primaire basée par exemple sur
plages de valeurs p. * Le premier fichier doit avoir des étiquettes de plage dans la première colonne,
p-valeur

limites inférieures dans la deuxième colonne et limites supérieures dans la troisième colonne. Lignes
avec trop peu d'entrées, ou des valeurs non numériques dans la deuxième ou la troisième colonne, sont
ignoré.

* Le deuxième fichier doit contenir un identifiant de variante et une valeur p pour chaque

ligne non vide (sauf éventuellement la première).
Les ID de variante sont lus à partir de

la colonne #i et les valeurs p sont lues à partir de la colonne #j, où i par défaut est 1 et j
par défaut à i+1. Le modificateur 'header' provoque la première ligne non vide de ce fichier
à sauter.

--parallèle [k] [n] : diviser la matrice de sortie en n morceaux et ne calculer que
la ke pièce. Le fichier de sortie principal aura le numéro de pièce inclus dans son
nom, par exemple plink.rel.13 ou plink.rel.13.gz si k vaut 13. Concaténer ces fichiers
dans l'ordre donnera la matrice complète d'intérêt. (Oui, cela peut être fait avant
décompression.) NB Ceci ne peut généralement pas être utilisé pour écrire directement un
Matrice Carrée. Choisissez plutôt la forme carré0 ou triangle et post-traitez comme
nécessaire.

--Mémoire [val]
: définit la taille, en Mo, de la tentative initiale de malloc de l'espace de travail. (Pratiquement obligatoire
lors de l'utilisation de GNU parallèle.)

--threads [val]
: définit le nombre maximal de threads simultanés. Cela a une limitation connue : certains
Les opérations d'algèbre linéaire BLAS/LAPACK sont multithread d'une manière que PLINK ne peut pas
contrôler. Si cela pose problème, vous devez recompiler avec un seul thread
BLAS/LAPACK.

--ré [carboniser]
: Modifier le délimiteur de plage de variante/covariable (normalement '-').

--la graine [val...]
: Définir la ou les graines de nombres aléatoires. Chaque valeur doit être un entier compris entre 0 et
4294967295 inclus.

--perm-batch-size [val] : définit le nombre de permutations par lot pour certains
essais de permutation.

--sortie-min-p [p] : spécifiez la valeur p minimale à écrire dans les rapports.

--déboguer
: Utilisez une méthode de journalisation plus lente et plus résistante aux pannes.

Document sur les méthodes primaires : Chang CC, Chow CC, Tellier LCAM, Vattikuti S, Purcell SM, Lee JJ
(2015) PLINK de deuxième génération : relever le défi d'ensembles de données plus grands et plus riches.
GigaScience, 4.

Pour plus de documentation et d'assistance, consultez la page Web principale
(https://www.cog-genomics.org/plink2 ) et/ou la liste de diffusion
(https://groups.google.com/d/forum/plink2-users).

Utilisez plink1.9 en ligne à l'aide des services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad




×
Publicité
❤ ️Achetez, réservez ou achetez ici — gratuitement, contribue à maintenir la gratuité des services.