鱼C论坛

 找回密码
 立即注册
查看: 3575|回复: 15

爬虫代码出错

[复制链接]
发表于 2020-2-28 12:44:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import re
import json


def main():

  with open("items.txt" ,"r" ,encoding = "utf-8") as file1:
    g_page_config = re.search(r"g_page_config = (.*?);\n" , file1.read())
    with open("g_page_config.txt" ,"w" , encoding = "utf-8") as file2:
      file2.write(g_page_config.group(1))
   
if __name__ == "__main__":
  main()


报错:AttributeError: 'NoneType' object has no attribute 'group'

ps:可以看小甲鱼的 爬虫篇 极客Python之效率革命的统计淘宝某宝贝胡销量(上)

求改正代码方法和解释,谢谢
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-2-28 12:45:37 | 显示全部楼层
ps:可以看小甲鱼的 爬虫篇 极客Python之效率革命的统计淘宝某宝贝的销量(上)
打错了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-28 12:47:49 | 显示全部楼层
小甲鱼de粉丝 发表于 2020-2-28 12:45
ps:可以看小甲鱼的 爬虫篇 极客Python之效率革命的统计淘宝某宝贝的销量(上)
打错了

请用代码格式发代码!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-28 12:52:00 | 显示全部楼层
要会看错误代码啊
'NoneType' object has no attribute 'group'
说明你的g_page_config是None 即 g_page_config = re.search(r"g_page_config = (.*?);\n" , file1.read()) 这里没有值
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 12:52:03 | 显示全部楼层
  1. import re
  2. import json


  3. def main():

  4.   with open("items.txt" ,"r" ,encoding = "utf-8") as file1:
  5.     g_page_config = re.search(r"g_page_config = (.*?);\n" , file1.read())
  6.     with open("g_page_config.txt" ,"w" , encoding = "utf-8") as file2:
  7.       file2.write(g_page_config.group(1))
  8.    
  9. if __name__ == "__main__":
  10.   main()
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 12:52:34 | 显示全部楼层
qiuyouzhi 发表于 2020-2-28 12:47
请用代码格式发代码!

抱歉,忘记了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-28 13:08:15 | 显示全部楼层

试试把group后面的括号改成中括号
还有,能不能把items.txt和g_page_config发上来?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-28 13:13:02 | 显示全部楼层

re.search是没有返回值的
试试findall?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 14:04:41 | 显示全部楼层
qiuyouzhi 发表于 2020-2-28 13:13
re.search是没有返回值的
试试findall?

我不会用
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-28 14:06:21 | 显示全部楼层


那就只能学学了
或者你想另外一种办法存储search函数的返回值
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 15:58:43 | 显示全部楼层
qiuyouzhi 发表于 2020-2-28 14:06

那就只能学学了
或者你想另外一种办法存储search函数的返回值

哦,那我去学一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 15:59:15 | 显示全部楼层
qiuyouzhi 发表于 2020-2-28 13:08
试试把group后面的括号改成中括号
还有,能不能把items.txt和g_page_config发上来?

太长了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-29 19:42:48 | 显示全部楼层
qiuyouzhi 发表于 2020-2-28 14:06

那就只能学学了
或者你想另外一种办法存储search函数的返回值

我找到一个东西
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-29 19:44:15 | 显示全部楼层
qiuyouzhi 发表于 2020-2-28 14:06

那就只能学学了
或者你想另外一种办法存储search函数的返回值

这个
E0404072-FFF8-4395-A71E-8709ABB3BF3F.png
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-29 19:46:21 | 显示全部楼层
yjsx86 发表于 2020-2-28 12:52
要会看错误代码啊
'NoneType' object has no attribute 'group'
说明你的g_page_config是None 即 g_page ...

我只会看一些错误
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-29 19:47:24 | 显示全部楼层

items里的确没有g_page....
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-22 23:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表