900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > Python获取网页所有超链接

Python获取网页所有超链接

时间:2021-07-11 05:50:03

相关推荐

Python获取网页所有超链接

import requestsfrom bs4 import BeautifulSoupdef getHTMLText(url):'''此函数用于获取网页的html文档'''try:#获取服务器的响应内容,并设置最大请求时间为6秒res = requests.get(url, timeout = 6)#判断返回状态码是否为200res.raise_for_status()#设置该html文档可能的编码res.encoding = res.apparent_encoding#返回网页HTML代码return res.textexcept:return '产生异常'def main():'''主函数'''#目标网页,这个可以换成一个你喜欢的网站url = '/huwt/'demo = getHTMLText(url)#解析HTML代码soup = BeautifulSoup(demo, 'html.parser')#模糊搜索HTML代码的所有包含href属性的<a>标签a_labels = soup.find_all('a', attrs={'href': True})#获取所有<a>标签中的href对应的值,即超链接for a in a_labels:print(a.get('href'))main()

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。