Il est difficile de vérifier la section TV à chaque fois quel est le film de ce road show du vendredi. Alors, je me suis demandé si je pouvais obtenir le nom du film du Friday Roadshow depuis le terminal du PC avec une seule commande en utilisant le Web scraping de Python.
--Affichez le titre du film qui sera diffusé vendredi prochain avec une seule commande sur le terminal.
Site Web de la tournée du vendredi
...
<li>
<div class="photo">
<a href='/lineup/20170414'>
<img src="https://dtg3yjoeemd2c.cloudfront.net/pic/lineup/20170414/photo01_p62bphcy8m.jpg " alt="Détective Conan: Un cauchemar noir pur" />
</a>
</div>
...
</li>
<li>
<div class="photo">
<a href='/lineup/20170421'>
<img src="https://dtg3yjoeemd2c.cloudfront.net/pic/lineup/20170421/photo01_uyxdjywd.jpg " alt="Cendrillon" />
</a>
</div>
...
</li>
<li>
<div class="photo">
<a href='/lineup/20170428'>
<img src="https://dtg3yjoeemd2c.cloudfront.net/pic/lineup/20170428/photo01_9txwertpu3.jpg " alt="Mission Wild Speed Sky" />
</a>
</div>
...
</li>
...
kinro.py
#coding:utf-8
import urllib.request
import datetime
from bs4 import BeautifulSoup
def func():
html = urllib.request.urlopen("https://kinro.jointv.jp/lineup")
soup = BeautifulSoup(html, "lxml")
today = datetime.date.today()
nextFriday = today + datetime.timedelta(days = (4 - today.weekday()) % 7)
strnextFriday = nextFriday.strftime("%Y%m%d")
a = soup.find_all("a", href = "/lineup/" + strnextFriday)
tmp = a[0].find("img")
title = tmp.attrs['alt']
print(title)
if __name__ == '__main__':
func()
Ouvrez un terminal et dans le même répertoire que ce code,
$python kinro.py
Exécutez la commande
Détective Conan: Un cauchemar noir pur#D'ici le 14 avril 2017
Cendrillon#15 avril 2017~21e
Si le titre du film est affiché comme, cela réussit.
Bien sûr, dans .barhrc
alias kinro='python ~/my_dir/kinro.py' #Le nom du répertoire correspond à l'environnement
Si vous définissez cette commande comme ceci, vous pouvez obtenir le nom du film du road show de vendredi prochain avec une commande de $ kinro
sur n'importe quel répertoire.
Les deux premières lignes.
kinro.py(partie)
html = urllib.request.urlopen("https://kinro.jointv.jp/lineup")
soup = BeautifulSoup(html, "lxml")
Lignes 3-5. J'obtiens la date d'aujourd'hui et je calcule la différence en jours entre là et vendredi prochain.
kinro.py(partie)
today = datetime.date.today()
nextFriday = today + datetime.timedelta(days = (4 - today.weekday()) % 7)
strnextFriday = nextFriday.strftime("%Y%m%d")
Lignes 6-9.
kinro.py(partie)
a = soup.find_all("a", href = "/lineup/" + strnextFriday)
tmp = a[0].find("img")
title = tmp.attrs['alt']
print(title)
En ligne 6
Site Web de la tournée du vendredi
<a href='/lineup/20170414'>
<img src="https://dtg3yjoeemd2c.cloudfront.net/pic/lineup/20170414/photo01_p62bphcy8m.jpg " alt="Détective Conan: Un cauchemar noir pur" />
</a>
Sortez la partie de, et plus loin de là sur la 7ème ligne
Site Web de la tournée du vendredi
<img src="https://dtg3yjoeemd2c.cloudfront.net/pic/lineup/20170414/photo01_p62bphcy8m.jpg " alt="Détective Conan: Un cauchemar noir pur" />
De là sur la 8ème ligne
Détective Conan: Un cauchemar noir pur
Seule la partie de est retirée.
Recommended Posts