J'étudie Python par moi-même. Je ne connais pas encore les détails, mais je noterai le phénomène sur lequel je suis tombé par hasard. Au fait, c'est ** Python 3.8.5 **
J'ai essayé d'extraire la balise de titre.
code
# html_parser.py
import requests
from bs4 import BeautifulSoup
#URL que vous souhaitez obtenir
url = "http://example.com"
#Obtenez du HTML en envoyant une requête HTTP avec une URL comme argument
response = requests.get(url)
#Le code de caractère est automatiquement codé
response.encoding = response.apparent_encoding
#Analyse HTML
bs = BeautifulSoup(response.text, 'html.parser')
title_tag = bs.find('title')
#Sortie de la partie texte de la balise extraite
print(title_tag.text)
J'ai eu une erreur d'importation pour Beautiful Soup.
résultat
Traceback (most recent call last):
File "c:/python/html.py", line 3, in <module>
from bs4 import BeautifulSoup
File "C:\Users\*****\AppData\Local\Programs\Python\Python38\lib\site-packages\bs4\__init__.py", line 31, in <module>
from .builder import builder_registry, ParserRejectedMarkup
File "C:\Users\*****\AppData\Local\Programs\Python\Python38\lib\site-packages\bs4\builder\__init__.py", line 7, in <module>
from bs4.element import (
File "C:\Users\*****\AppData\Local\Programs\Python\Python38\lib\site-packages\bs4\element.py", line 19, in <module>
from bs4.formatter import (
File "C:\Users\*****\AppData\Local\Programs\Python\Python38\lib\site-packages\bs4\formatter.py", line 1, in <module>
from bs4.dammit import EntitySubstitution
File "C:\Users\*****\AppData\Local\Programs\Python\Python38\lib\site-packages\bs4\dammit.py", line 13, in <module>
from html.entities import codepoint2name
File "c:\python\html.py", line 3, in <module>
from bs4 import BeautifulSoup
ImportError: cannot import name 'BeautifulSoup' from partially initialized module 'bs4' (most likely due to a circular import) (C:\Users\*****\AppData\Local\Programs\Python\Python38\lib\site-packages\bs4\__init__.py)
Si ce n'est pas dit, ce qui suit a été fait
python
pip install beautifulsoup
Même avec la liste des pip beautifulsoup4 4.9.1 Peut être confirmé.
Alors pourquoi ...
Il semble que Python a un package appelé "html" et l'a chargé ...
Recommended Posts