蟒蛇美丽汤在div标签本身中提取数据

提问者：小点点

蟒蛇美丽汤在div标签本身中提取数据

我正在尝试使用Pythons beautifulSoup从HTML文件中提取数据。下面一行HTML是我感兴趣的。

<div class="myself" title="Name@email.com [11:07:27 AM]">
     <nobr>Name</nobr></div>

我想提取标题(与电子邮件和时间戳)。我可以使用访问该类...

find('div', attrs={'class':'myself'}))

我可以从那里打印＜code＞div＜/code＞的全部内容或div中的标记中的信息，但我不知道如何获取＜code>title＜/code>，因为它位于同一个＜code〕div＜/code＞标记中

共2个答案

匿名用户

可以以类似字典的方式检索属性:

一个标签可以有任意数量的属性。您可以通过将标签视为字典来访问标签的属性。

from bs4 import BeautifulSoup

soup = BeautifulSoup(data)
div = soup.find("div", class_="myself", title=True)
print(div["title"])

匿名用户

用可能这个方法

>>>import bs4
>>>html_string = "<div class="myself" title="Name@email.com [11:07:27 AM]">
 <nobr>Name</nobr></div>"
>>>title_string = bs4.BeautifulSoup(html_string).div.attrs['title']
>>>print(title_string)
'Name@email.com [11:07:27 AM]'

蟒蛇美丽汤在div标签本身中提取数据

共2个答案

相关问题

热门标签

蟒蛇美丽汤在div标签本身中提取数据

共2个答案

相关问题

热门标签

微信关注