[已解决]关于遍历finditer产生的迭代器时卡死的问题

菜de嚣张 · 发表于 2021-8-10 11:40:46

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

如图，程序处理迭代器时里面的语句一条也没执行，就一直卡着，后面的散热风扇明显转动加快了，而且ctrl+c也没法终止程序
Screenshot 2021-08-10 114007.png

最佳答案

月排行榜 / 总排行榜

大马强

2021-8-10 12:09:38

先指出能第一眼看出的错误

newstr=it.group(name)+'/'+it.group(score)+'/'+it.group(summary)+'\n'

复制代码

要用字符串 it.group("name")

跳转到最佳答案楼层

大马强 · 发表于 2021-8-10 11:52:18

发发代码

菜de嚣张 · 发表于 2021-8-10 12:01:27

大马强发表于 2021-8-10 11:52
发发代码

#爬取豆瓣TOP250
import requests
import re
url = 'https://movie.douban.com/top250'
headers ={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
res0=requests.get(url,headers=headers)
res=res0.text
res0.close()
print('获取完毕')
regu=re.compile(r'<li>.*?(?P<name>.*?).*?'\
r'(?P<score>.*?)'\
r' (?P<style>.*?).*?(?P<summary>)',re.S)
its = regu.finditer(res)
print('处理完毕')
print(its)
f = open('豆瓣.txt','w')
for it in its:
print('进来啦...')
newstr=it.group(name)+'/'+it.group(score)+'/'+it.group(summary)+'\n'
f.write(newstr)
print('完成......')
break
f.close()

大马强 · 发表于 2021-8-10 12:07:50

菜de嚣张发表于 2021-8-10 12:01
#爬取豆瓣TOP250
import requests
import re

ok，我现在看看

大马强 · 发表于 2021-8-10 12:09:38

先指出能第一眼看出的错误

newstr=it.group(name)+'/'+it.group(score)+'/'+it.group(summary)+'\n'

复制代码

要用字符串 it.group("name")

菜de嚣张 · 发表于 2021-8-10 12:10:48

大马强发表于 2021-8-10 12:09
先指出能第一眼看出的错误

要用字符串 it.group("name")

这...我看半天楞没发现

菜de嚣张 · 发表于 2021-8-10 12:12:12

大马强发表于 2021-8-10 12:09
先指出能第一眼看出的错误

要用字符串 it.group("name")

还是不行呀，它前面的那句话都没运行

大马强 · 发表于 2021-8-10 12:23:45

菜de嚣张发表于 2021-8-10 12:12
还是不行呀，它前面的那句话都没运行

我只是先提出能第一眼看见的问题，我感觉可能是正则匹配的问题，我还在看

大马强 · 发表于 2021-8-10 12:43:44

搞定，我就是不知道你style是匹配什么的，原因是正则表达式

url = 'https://movie.douban.com/top250'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
res0 = requests.get(url, headers=headers)
res = res0.text
res0.close()
print('获取完毕')
regu = re.compile(
r'.*?(?P<name>.*?).*?(?P<score>.*?).*?(?P<summary>.*?)</span.*?', re.S)
its = regu.finditer(res)
# regu = re.compile(r'.*?(?P<name>.*?).*?(?P<score>.*?).*?(?P<summary>)', re.S)
# its = regu.finditer(res)
# print(its)
f = open('豆瓣.txt', 'w', encoding="utf-8")
for it in its:
print('进来啦...')
newstr = it.group('name')+'/'+it.group('score') + \
'/'+it.group('summary')+'\n'
f.write(newstr)
print('完成......')
f.close()

复制代码

菜de嚣张 · 发表于 2021-8-10 13:09:56

大马强发表于 2021-8-10 12:43
搞定，我就是不知道你style是匹配什么的，原因是正则表达式

啊确实，可是为什么匹配数为0的时候会卡死呢？迭代器里面没东西时没法迭代吗

大马强 · 发表于 2021-8-10 13:11:09

菜de嚣张发表于 2021-8-10 13:09
啊确实，可是为什么匹配数为0的时候会卡死呢？迭代器里面没东西时没法迭代吗

应该把，但我感觉是匹配花时间，但看你截图不像

菜de嚣张 · 发表于 2021-8-10 13:17:31

大马强发表于 2021-8-10 13:11
应该把，但我感觉是匹配花时间，但看你截图不像

好的，谢谢

账号		自动登录	找回密码
密码			立即注册