import requestsfrom bs4 import BeautifulSoupdef getHTMLText(url):'''此函数用于获取网页的html文档'''try:#获取服务器的响应内容,并设置最大请求时间为6秒res = requests.get(url, timeout = 6)#判断返回状态码是否为200res.raise_for_status()#设置该html文档可能的编码res.encoding = res.apparent_encoding#返回网页HTML代码return res.textexcept:return '产生异常'def main():'''主函数'''#目标网页,这个可以换成一个你喜欢的网站url = '/huwt/'demo = getHTMLText(url)#解析HTML代码soup = BeautifulSoup(demo, 'html.parser')#模糊搜索HTML代码的所有包含href属性的<a>标签a_labels = soup.find_all('a', attrs={'href': True})#获取所有<a>标签中的href对应的值,即超链接for a in a_labels:print(a.get('href'))main()
900字范文,内容丰富有趣,生活中的好帮手!