|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
今天按照小甲鱼的教程写了一个基于scrapy框架的爬虫,小甲鱼将dmoz网站的内容保存为json格式后记事本打开可以正常观看。
我爬的是博客园的文章。爬出来json保存后,打开是这样的(下面贴出来其中一条结果):
{"title": ["Dotnet Core IHttpClientFactory\u6df1\u5ea6\u7814\u7a76"], "link": ["https://www.cnblogs.com/tiger-wang/p/13752297.html"], "describe": ["\n ", "\n \u4eca\u5929\uff0c\u6211\u4eec\u6df1\u5ea6\u7814\u7a76\u4e00\u4e0bIHttpClientFactory\u3002 \u4e00\u3001\u524d\u8a00 \u6700\u65e9\uff0c\u6211\u4eec\u662f\u5728Dotnet Framework\u4e2d\u63a5\u89e6\u5230HttpClient\u3002 HttpClient\u7ed9\u6211\u4eec\u63d0\u4f9b\u4e86\u4e0eHTTP\u4ea4\u4e92\u7684\u57fa\u672c\u65b9\u5f0f\u3002\u4f46\u8fd9\u4e2aHttpClient\u5728\u5927\u91cf\u9891\u7e41\u4f7f\u7528\u65f6\uff0c\u4e5f\u4f1a\u7ed9\u6211\u4eec\u629b\u51fa\u4e24\u4e2a\u5927\u5751\uff1a\u4e00\u65b9\u9762\uff0c\u5982\u679c\u6211\u4eec\u9891\u7e41\u521b\u5efa ...\n "]}
请问怎么让它显示正确编码的文档呢?
|
|