Les chercheurs peuvent s'inquiéter du nombre de citations d'articles universitaires qu'ils ont consultés / écrits. Vous pouvez facilement vérifier le nombre de citations sur Google scholar, etc. En tant que précurseur du nombre de citations, il y a aussi le nombre de lecteurs dans le logiciel de gestion de la littérature Mendeley. Cela au moins ne semble pas être connu sans ouvrir Mendeley. Donc, après avoir pratiqué le grattage, j'ai créé un script pour obtenir le nombre de lecteurs de Mendeley.
[1] Web scraping avec python [2] Liste des précautions pour le scraping Web
Windows Python 3
Le texte intégral est ci-dessous. L'explication continue ci-dessous.
a.py
# Modules
import requests
# Constants
Mendeley = 'https://www.mendeley.com/catalogue/'
PaperID = []
PaperID.append("5a856ac7-0d75-3560-8824-9f9061f3eb50/")
# Functions
def SandwitchedText(text_source,text_1, text_2):
return text_source.split(text_1)[1].split(text_2)[0]
for a in PaperID:
r = requests.get(Mendeley + a)
text = r.text
print("Title : " + SandwitchedText(text, "\"title\":\"", "\",\"detail"))
print("readers : " + SandwitchedText(text, "readers:", ":"))
print("citations : " + SandwitchedText(text, "citations:", ":"))
--requests est un package qui peut être utilisé pour le scraping [1]. Faites attention aux règles de grattage lors de l'utilisation de [2].
Si vous augmentez le nombre d'articles dans la liste, vous pouvez obtenir des informations sur plusieurs articles à la fois. Je pense que c'est un peu plus intelligent si vous lui donnez un titre au lieu de l'URL du papier.
Recommended Posts