提问者:小点点

如何用Python和BeautifulSoup定位某些html标记


我想用Python和BeautifulSoup从div class=“wxcolumn wxColumn-seven dotw_0”中提取信息,直到div class=“wxcolumn wxColumn-seven dotw_6”,但我不知道如何定位这些div。 请帮帮我。 多谢。 这是我写的代码

import requests
from bs4 import BeautifulSoup

page = requests.get("https://www.meteomedia.com/ca/meteo/quebec/montreal")
soup = BeautifulSoup(page.content,"html.parser")
week = soup.find(id = "seven-day-periods")
items = soup.find_all('div', attrs={"class":'divTableBody'})

共1个答案

匿名用户

attrs不是必需的,就像我做的那样,如果它是一个你正在寻找的类

import requests
from bs4 import BeautifulSoup

page = requests.get("https://www.meteomedia.com/ca/meteo/quebec/montreal")
soup = BeautifulSoup(page.content,"html.parser")
week = soup.find(id = "seven-day-periods")
items = soup.find_all('div', {"class":'divTableBody'})

如果是id,只需替换类

items = soup.find_all('div', {"id":'divTableBody'})

等等,这个find_all在数组中返回,所以在它上有循环,但是还有另一个方法选择第一个匹配项,即find

相关问题