使用python清除html文本

提问者：小点点

使用python清除html文本

我如何才能得到单词罗杰费德勒只从下面的html

<div class="profile-heading--desktop"><h1><span class="profile-heading__rank">#1 </span>Roger Federer</h1><div class="profile-subheading">Athlete, Tennis</div></div>

我正在使用这个代码

name = soup.find(class_ = 'profile-heading__rank').get_text()

我得到了#1

共1个答案

匿名用户

使用.next_sibling获取

旁边的文本:

from bs4 import BeautifulSoup

html = """
<div class="profile-heading--desktop">
    <h1>
        <span class="profile-heading__rank">#1 </span>
        Roger Federer
    </h1>
    <div class="profile-subheading">
        Athlete, Tennis
    </div>
</div>
"""

soup = BeautifulSoup(html, 'html.parser')
name = soup.find(class_='profile-heading__rank').next_sibling

print(name)  # -->  Roger Federer

使用python清除html文本

共1个答案

相关问题

热门标签

使用python清除html文本

共1个答案

相关问题

热门标签

微信关注