Récemment, j'ai commencé à utiliser PLINK, un logiciel de statistiques génétiques. Apprenez à utiliser PLINK en vous référant à ce livre.
Séminaire pratique à partir de zéro sur les statistiques génétiques
Ce livre est écrit pour Windows, j'écrirai donc un rappel sur la façon de le faire sur Mac. Cette fois, j'ai essayé l'analyse eQTL avec PLINK.
L'utilisation de base de PLINK et de la méthode d'analyse GWAS a déjà été publiée. [Linux] J'ai essayé d'utiliser le logiciel de statistiques génétiques PLINK [Linux] GWAS avec logiciel de statistiques génétiques PLINK
Fichiers filtrés SNP
Données sur le niveau d'expression du gène BLK
Dans l'analyse eQTL, une analyse linéaire est effectuée afin d'analyser le trait quantitatif du niveau d'expression génique.
Liste des commandes à utiliser.
--pheno
: Entrez le fichier d'expression (Exp_BLK.txt cette fois) utilisé pour GWAS
--linear
: effectuer une régression linéaire
`` --ci 0.95 '': sortie intervalle de confiance à 95%
GWAS (analyse linéaire)
$ ./plink --bfile SNP_QC --out SNP_QC_Exp_BLK --pheno Exp_BLK.txt --linear --ci 0.95
Confirmez que le fichier nommé ** SNP_QC_Exp_BLK.assoc.linear ** est sorti dans le répertoire de travail et ouvrez-le avec un éditeur de texte. La première colonne est le numéro du chromosome, la deuxième colonne est l'ID SNP, la troisième colonne est la position du chromosome et la douzième colonne est la valeur * p *.
À partir du résultat GWAS, utilisez la commande AWK pour extraire les colonnes «numéro de chromosome», «ID SNP», «position du chromosome» et «valeur * p *».
Utilisez la commande AWK pour définir le fichier d'entrée sur ** SNP_QC_Exp_BLK.assoc.linear ** et le fichier de sortie sur ** SNP_QC_Exp_BLK.assoc.linear.P.txt *.
Dans AWK, séparez-les par «» et écrivez-y des commandes pour les exécuter.
Par {print $ 2 "\ t" $ 1 "\ t" $ 3 "\ t" $ 12}
La trame de données est "2ème colonne [ID SNP] 1ère colonne [numéro de chromosome] 3ème colonne [position du chromosome] 4ème colonne [ p * valeur]".
La commande que "\ t"
est séparée par des tabulations.
Sortie sous forme de fichier texte spécifié par ``> ''.
Extraire des éléments des résultats GWAS avec la commande AWK et le fichier texte de sortie
$ awk '{print $2"\t"$1"\t"$3"\t"$12}' SNP_QC_Exp_BLK.assoc.linear > SNP_QC_Exp_BLK.assoc.linear.P.txt
Dessinez un graphique de Manhattan en utilisant ce résultat GWAS.
Quand j'ai dessiné un complot de Manhattan, ça ressemblait à ça.
Extrayons le SNP qui a montré l'effet eQTL.
Extraire SNP avec AWK
awk '$4<=10^-12 {print $0}' 1KG_EUR_QC_Exp_BLK.assoc.linear.P.txt
production
rs13255193 8 11309192 4.539e-13
rs13257831 8 11332964 6.545e-13
rs2736345 8 11352485 1.707e-14
rs1478898 8 11395079 6.882e-16
rs2244894 8 11448659 1.497e-13
rs2244648 8 11450422 2.068e-14
rs13273172 8 11461111 1.188e-14
Le SNP avec la plus petite valeur * p * était ** rs1478898 **.
Recommended Posts