|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
https://www-engineeringvillage-c ... sageZone=nextrecord
在这个地址中,用浏览器审查元素可以看到<a href="mailto:ysun58@iphy.ac.cn" title="Sun, Yong Hao email" aria-label="Sun, Yong Hao email" class="emaillink"><span class="ss-mail"></span></a>这段内容,我想吧整个网页抓取下来筛选出里面的邮箱。
可是我用 req = urllib.request.Request('url')
req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.162 Safari/537.36')
respunse = urllib.request.urlopen('url')
html = respunse.read().decode('utf-8')
print(html)
打印出来的代码里没有我想要的那一段内容。而在网页中这个邮箱是一个类似链接的信封按钮,要右键复制邮箱地址才能获取内容。我想知道python能不能实现爬取这个网站的邮箱。大致的方法是怎么样的。
谢谢大佬。 |
|