鱼C论坛

 找回密码
 立即注册
查看: 2422|回复: 1

scrapy爬取后对json文件的处理

[复制链接]
发表于 2017-2-25 19:25:03 | 显示全部楼层 |阅读模式
5鱼币
跟着小甲鱼把dmoz给爬了下来 保存成了json文件  
后来我想把其中的title提取出来 存到另外一个txt文件 但是json是列表里面有字典的格式 而且每个题目前面都有 u(我猜是代表编码形式)
请问怎么提取??
import json
import re
f = open('C:\\Users\\石\\Desktop\\items.json') 
a = json.load(f)

用了上述处理后 打出来的a是
[{u'web': [u'http://www.pythonware.com/daily/'], u'des': [u'\r\n\t\t\t\r\n                                    Contains links to assorted resources from the Python universe, compiled by PythonWare.\r\n                                    ', u'\r\n                                  '], u'title': [u"eff-bot's Daily Python URL "]}]

怎么获得eff-bot‘s Daily Python URL ??
@小甲鱼

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-2-28 13:19:37 | 显示全部楼层
a[0]['title']

a列表有1个元素a[0]
里面是字典,用键访问 a[0]['title']
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-10-6 22:30

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表