https://yokonoji.work/python-scraping-6 https://qiita.com/akabei/items/0eac37cb852ad476c6b9
requests BeautifulSoup oauth2client gspread
La clé de compte de service pour accéder à la feuille de calcul Google est telle qu'elle est écrite sur le site de référence, alors écrivez-la grossièrement. m (_ _) m
↓ Sur le site https://console.developers.google.com/cloud-resource-manager
↓ exécuter --Créer un projet
--Création de feuille de calcul --Depuis "Partager", partagez l'adresse de "client_email" écrite dans le JSON téléchargé
sample.py
import requests
import gspread
from bs4 import BeautifulSoup
from oauth2client.service_account import ServiceAccountCredentials
url = "<URL du site à obtenir>"
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')
elements = soup.select('<Les balises que vous souhaitez obtenir>')#select()Puisqu'il utilise une méthode, il peut être écrit avec "CSS selector"
scope = ['https://spreadsheets.google.com/feeds',
'https://www.googleapis.com/auth/drive']
credentials = ServiceAccountCredentials.from_json_keyfile_name('<Nom du fichier JSON téléchargé>', scope)
gc = gspread.authorize(credentials)
wks = gc.open('<Nom de la feuille de calcul>').sheet1
for index, e in enumerate(elements):
num = index + 1 #Puisqu'il n'y a pas de «0» dans le numéro de la feuille de calcul, ajoutez d'abord 1
wks.update_acell('A'+str(num) , e.get_text())
Recommended Posts