Je pense que j'aurai besoin de la génétique statistique au travail, alors j'ai essayé d'utiliser le logiciel de statistiques génétiques PLINK. Récemment, un joli livre a été publié, alors je l'ai essayé.
Séminaire pratique à partir de zéro sur les statistiques génétiques
Cependant, comme ce livre est écrit pour Windows, j'ai pensé que je devrais écrire un mémorandum sur la façon de le faire sur Mac. Ce livre est bon.
Téléchargez la version MacOS de PLINK à partir de la page suivante.
Lancez le terminal Mac. Sur le terminal, spécifiez le répertoire de travail avec la commande `` cd ''.
Spécifier un répertoire de travail
$ cd /Chemin du répertoire de travail/
Déplacez le ** PLINK ** (fichier exécutable PLINK) téléchargé dans votre répertoire de travail.
Sur le terminal, tapez . / Plink
.
Démarrer PLINK
$ ./plink
Résultat d'exécution
PLINK v1.90b6.16 64-bit (19 Feb 2020) www.cog-genomics.org/plink/1.9/
(C) 2005-2020 Shaun Purcell, Christopher Chang GNU General Public License v3
plink <input flag(s)...> [command flag(s)...] [other flag(s)...]
plink --help [flag name(s)...]
Commands include --make-bed, --recode, --flip-scan, --merge-list,
--write-snplist, --list-duplicate-vars, --freqx, --missing, --test-mishap,
--hardy, --mendel, --ibc, --impute-sex, --indep-pairphase, --r2, --show-tags,
--blocks, --distance, --genome, --homozyg, --make-rel, --make-grm-gz,
--rel-cutoff, --cluster, --pca, --neighbour, --ibs-test, --regress-distance,
--model, --bd, --gxe, --logistic, --dosage, --lasso, --test-missing,
--make-perm-pheno, --tdt, --qfam, --annotate, --clump, --gene-report,
--meta-analysis, --epistasis, --fast-epistasis, and --score.
"plink --help | more" describes all functions (warning: long).
PLINK est exécuté avec `` ./plink-(command) (argument) ''.
Les commandes de lecture de fichier sont --file
et --bfile
.
--file
lit les données génotypiques au format ** ped | map .
--bfile
Estbed|bim|famLire les données de génotype de format.
Données NGSvcfLe format est basique,ped|mapDonnées converties au format,ped|mapFormat converti en format binairebed|bim|fam**Utilisez le format.
--out
spécifie le nom du fichier de sortie.
Ce fichier a été stocké dans le répertoire de travailSNP.bed、SNP.bim、SNP.famdebed|bim|famFormat.
Par conséquent, l'argument de --bfile
est SNP
avant l'extension du fichier.
Lire le fichier
$ ./plink --bfile SNP --out test
Cela générera un fichier appelé ** test.log **. Ouvrez ce fichier avec un éditeur de texte ou la commande suivante.
$ less test.log
Vous pouvez calculer la fréquence d'allergène de chaque SNP avec `` --freq ''.
Calculer la fréquence des allèles SNP
$ ./plink --bfile SNP --out test1 --freq
Ouvrez le fichier de sortie avec un éditeur de texte ou la commande suivante.
$ less test1.frq
Avant l'analyse, les données génomiques sont filtrées pour exclure les SNP avec une fréquence d'allèle mineur (MAF) de 1% ou 0,5% ou moins.
Manière dans GWAS.
Excluez les SNP de MAF en dessous de la valeur numérique avec --maf (valeur numérique) ''.
--make-bed``Nouvelles données filtrées avecbed|bim|famCréé en tant que fichier de format.
Cette fois, les SNP de 1% ou moins sont exclus.
Filtrer le SNP par fréquence d'allergène mineur
$ ./plink --bfile SNP --out test2 --maf 0.01 --make-bed
Recommended Posts