|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
为什么python用小甲鱼老师的方法保存成json的格式 文字自动变成ASCII码?
- import scrapy
- from diyici.items import ppazzItem
- class ppazzSpider(scrapy.Spider):
- name = "ppazz"
- allowed_domains = ['ppazz.cn']
- start_urls= [
- 'http://www.ppazz.cn/'
- ]
- def parse(self,response):
- sel = scrapy.selector.Selector(response)
- sites = sel.xpath('//div[@class="category"]/ul/li')
- items = []
- for site in sites:
- item = ppazzItem()
- item['title'] = site.xpath('a/text()').extract()
- item['link'] = site.xpath('a/@href').extract()
- item['desc'] = site.xpath('text()').extract()
- #print(title,link,desc)
- items.append(item)
- return items
复制代码
运行之后cmd找到目录 然后用 scrapy crawl ppazz -o 123.json -t json 命令 保存下来之后……………………就如图了
中文全都变成ASCII码了 这是怎么回事啊
|
|