scrapy 爬取淘宝商品信息，中文显示问题

taigefcxj · 发表于 2018-9-11 14:35:36

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

class TaobaoSpider(scrapy.Spider):
name = 'taobao'
allowed_domains = ['s.taobao.com']
start_urls = ['https://s.taobao.com/search?q=%E7%94%B7%E8%A3%85&bcoffset=0&ntoffset=0&s=132']

def parse(self, response):
rsp = response.body.decode("utf-8")
print(rsp)

在scrapy下随便爬取一个淘宝页面这样输出的信息似乎是unicode编码

请问怎么让他在scrapy输出中文

幽梦三影 · 发表于 2018-9-11 17:58:54

试试response.text

wongyusing · 发表于 2018-9-12 08:45:18

商品信息藏在页面的第三个scipt语句的第一段json。你用utf-8打开即可。
不需要转化的

账号		自动登录	找回密码
密码			立即注册

scrapy 爬取淘宝商品信息，中文显示问题

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块