我正在尝试使用python获取本地sharepoint页面的html对象,当我尝试发送请求时,收到403错误。下面是我正在使用的代码。
从请求导入请求\u ntlm import HttpNtlmAuth request=请求。得到(”https://my.mycompany.net/Profile.aspx?acname=i:0#.f|会员资格|parametertext@company.net,auth=HttpNtlmAuth('domain\userid','mypassword'))打印(请求)
你能告诉我为什么会出现403错误吗?还有没有其他方法可以获取sharepoint页面的html?我使用beautifulsoap尝试了如下的简单请求,但仍然得到错误403。
requests.get(url)
soup=BeautifulSoup(response.text,“html.parser”)
我的目标是根据类名、ID或标记获取页面上的数据。
请让我知道如何解决这个问题。
您可能需要在Web应用程序上启用基本身份验证。打开Internet信息服务管理器,在左侧的“站点”下找到您的Web应用程序。Dubble单击身份验证,单击基本身份验证并启用。并使用以下代码获取整个页面的HTML。
import requests
from requests.auth import HTTPBasicAuth
r = requests.get("http://example", auth=HTTPBasicAuth('someUser', 'somePassword'), headers=headers)
print r.status_code
print r.content
请参阅:使用Python通过REST从SharePoint请求数据