[已解决]【爬虫】网页的文本被隐藏了？如何爬取？

脑子 · 发表于 2018-2-17 02:48:56

您需要登录才可以下载或查看，没有账号？立即注册

x

爬取的网站：url=http://www.news.cn/politics/

我想爬取其中一部分的新闻：
FF9[K[EL5SGYW__B}PWV4)5.png

审查元素：

然后我用以下代码简单爬了一下，获取了html保存在TXT中：

#!/usr/bin/env python
#--*-- coding: utf-8--*--
import urllib2
import urllib
url='http://www.news.cn/politics/'
req=urllib2.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.86 Safari/537.36')
page=urllib2.urlopen(req)
html=page.read().decode('utf-8')
f=open('a.txt','wb')
f.write(html.encode('utf-8'))