鱼C论坛

 找回密码
 立即注册
查看: 1775|回复: 3

[已解决]代码运行问题

[复制链接]
发表于 2017-10-30 18:41:11 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import requests
  2. import re
  3. headers = {
  4.   "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 UBrowser/6.2.3637.802 Safari/537.36"
  5. }
  6. content = requests.get('https://book.douban.com/',headers=headers).text
  7. pattern = re.compile('<li.*?cover.*?href="(.*?)".*?title="(.*?)".*?mort-meta.*?author">(.*?)</span>.*?year>(.*?)</span>.*?</li>',re.S)
  8. results = re.findall(pattern,content)
  9. for link in results:
  10.     url,name,author,year = link
  11.     print(url,name,author,year)
复制代码

这是一段正则表达式提取链接,名字的代码
只要一运行,就什么也不出来
就想图片那样
是不是我电脑的问题还是服务器的问题
最佳答案
2017-10-31 08:02:18
正则表达式太复杂啦。我试着把“view-source:https://book.douban.com/”内容贴到 UltraEdit 里,然后搜:
  1. <li[\s\S]*?cover[\s\S]*?href="([\s\S]*?)"[\s\S]*?title="([\s\S]*?)"[\s\S]*?mort-meta[\s\S]*?author">([\s\S]*?)</span>[\s\S]*?year>([\s\S]*?)</span>[\s\S]*?</li>
复制代码

结果 UltraEdit 提示:
“匹配表达式的复杂性超过了可用的资源。”

想来 Python 执行楼主代码的时候,也是这么个情况,不过因为没有类似的提示,就一直卡在那里。

1509360026(1).jpg
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-10-30 22:00:51 | 显示全部楼层
有可能是内容太多,请耐心等待
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-10-31 08:02:18 | 显示全部楼层    本楼为最佳答案   
正则表达式太复杂啦。我试着把“view-source:https://book.douban.com/”内容贴到 UltraEdit 里,然后搜:
  1. <li[\s\S]*?cover[\s\S]*?href="([\s\S]*?)"[\s\S]*?title="([\s\S]*?)"[\s\S]*?mort-meta[\s\S]*?author">([\s\S]*?)</span>[\s\S]*?year>([\s\S]*?)</span>[\s\S]*?</li>
复制代码

结果 UltraEdit 提示:
“匹配表达式的复杂性超过了可用的资源。”

想来 Python 执行楼主代码的时候,也是这么个情况,不过因为没有类似的提示,就一直卡在那里。

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-10-31 10:35:10 | 显示全部楼层
Amazon 发表于 2017-10-31 08:02
正则表达式太复杂啦。我试着把“view-source:https://book.douban.com/”内容贴到 UltraEdit 里,然后搜:
...

我也感觉可能是 ,需要把表达式简化下了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-3 13:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表