La dernière fois, j'ai présenté comment obtenir des informations génétiques avec PhytoMine-Python. Cette fois, j'ai trouvé un moyen simple d'obtenir la séquence d'un gène avec PhytoMine-Python, donc pour rappel.
Cette fois, sélectionnez Proteins.
Cette fois, sélectionnez Populus trichocarpa.
Ensuite, le code Python sortira. Vous pouvez utiliser ce code en copier-coller. Comme c'est pour python2, il est nécessaire de réécrire l'instruction print, mais à part cela, il semble qu'elle puisse être utilisée telle quelle.
Ce qui suit est une modification pour enregistrer les données de l'espèce végétale spécifiée au format csv.
import pandas as pd
from intermine.webservice import Service
service = Service("https://phytozome.jgi.doe.gov/phytomine/service")
query = service.new_query("Protein")
query.add_constraint("organism.shortName", "=", "P. trichocarpa", code = "A")
seq_df = []
for row in query.rows(size=size):
seq_df.append(row)
seq_df = pd.DataFrame(seq_df,columns=row.keys())
seq_df.to_csv("20201005_Proteins_Top20.csv")
Il sera sauvé comme ça.
Puisqu'il s'agit d'un essai, j'essaie de ne sauvegarder que les 20 premiers gènes, mais en principe tous les gènes devraient pouvoir être sauvegardés à la fois.
En passant, vous pouvez sélectionner d'autres langues dans le menu déroulant.