Présentation d'une méthode de création d'arbre phylogénétique moléculaire ultra-simple à l'aide de la boîte à outils ETE.
(Figure: à partir de http://etetoolkit.org/documentation/ete-build/)
--BLAST (recherche de similarité de séquence) --MAFFT (alignement) https://mafft.cbrc.jp/alignment/server/ --trimAl (correction de l'alignement pour la construction de l'arbre phylogénétique), facultatif http://trimal.cgenomics.org/ --RAxML (calcul d'arbre physique) https://sco.h-its.org/exelixis/web/software/raxml/index.html
Types d'arbres phylogénétiques: arbre non raciné, arbre enraciné, Méthode de calcul de l'arbre phylogénétique: méthode NJ, méthode la plus probable, méthode Bayes
Comment construire un arbre phylogénétique en un instant à l'aide de ETE Toolkit. C'était tellement amusant que j'avais vraiment peur. Je voulais vraiment en faire un produit d'information payant, mais pour être honnête, j'étais vraiment inquiet. Et j'ai réalisé que je réfléchissais sérieusement et sérieusement. Je voudrais le publier spécialement cette fois.
On suppose que Python et Anaconda sont inclus. Si non inclus / suspect → macOS: Note de l'installation de Homebrew à la création de l'environnement Anaconda pour Python avec pyenv Linux: Notes sur la construction de l'environnement Anaconda pour Python avec pyenv dans un environnement Linux
$ pip install ete3 #Installer la boîte à outils ETE
$ conda install -c etetoolkit ete_toolchain #Installation des outils nécessaires
La grammaire est
$ ete3 build -w Nom du workflow-n Fichier de matrice d'entrée(Avant l'alignement) -o Nom du répertoire de destination de sortie--clearall
Exemple:
$ ete3 build -w mafft_linsi-none-none-raxml_default -n input.fasta -o output_tree --clearall
Seulement ça! Cela seul fera tout l'alignement multiple du tableau, le découpage de nombreuses zones d'espacement et l'estimation du système! !!
La syntaxe de ce workflow est ʻaligner-trimmer-tester-builderséparé par des tirets. Par exemple, le workflow
mafft_linsi-none-none-raxml_default Ensuite, alignez-vous sur l'algorithme L-INS-i de mafft et construisez un arbre phylogénétique avec RAxML. Si Paisen du laboratoire utilise clustal pour l'alignement! Si vous dites
clustalo_default-none-none-raxml_default, il s'alignera en utilisant clustal omega (successeur de clustal w). Si vous souhaitez inclure le processus d'ajustement de la zone d'espacement de la séquence à l'aide de trimAl, Vous pouvez utiliser
mafft_linsi-trimal01-none-raxml_default. Si vous souhaitez inclure le calcul de la valeur bootstrap lors de l'estimation de l'arbre phylogénétique Utilisez
mafft_linsi-none-none-raxml_default_bootstrap` (cela prendra un certain temps).
・ Peut-être qu'il est prudent de dire mafft_linsi-none-none-raxml_default_bootstrap
(désolé, désolé)
Les outils utilisables
$ ete3 build apps
Si tel est le cas, il sera affiché. Référence: composition de flux de travail personnalisés
Lorsque la commande de construction d'arbre phylogénétique dans l'exemple ci-dessus est exécutée,
Il générera divers fichiers de résultats dans . / Output_tree / mafft_linsi-none-none-raxml_default
.
Il contient divers fichiers,
・ Input.fasta.final_tree.png
→ Un diagramme chara qui montre l'arbre phylogénétique et le diagramme schématique de la séquence alignée ensemble.
・ Input.fasta.final_tree.fa
→ Fichier fasta aligné
・ Input.fasta.final_tree.nw
→ Fichier d'arbre phylogénétique estimé. Si vous chargez ceci dans FigTree ou iTOL, vous pouvez obtenir une belle figure.
Recommended Posts