bs4 正则

print "获取特定的URL地址"
link_node = soup.find('a',href="http://example.com/elsie")
print link_node.name,link_node['href'],link_node['class'],link_node.get_text()
 
print "正则表达式匹配"
link_node = soup.find('a',href=re.compile(r"ti"))
print link_node.name,link_node['href'],link_node['class'],link_node.get_text()
 
emailid_regexp = re.compile("\w+@\w+\.\w+")    # regexp 表达式对象
first_email_id = soup.find(text=emailid_regexp)
#  abc@example.com
- THE END -
版权声明:
转载原创文章请注明,文章出处://kinggoo.com
原文地址:https://kinggoo.com/bs4-%e6%ad%a3%e5%88%99.htm

评论关闭。