获取电影链接和电影名称的问题
import re, requestsurl = 'https://www.dytt8.net/'
r = requests.get(url)
r.encoding = 'gb2312'# 对返回的内容进行解码,charset=gb2312
# print(r.text)
obj = re.compile(r"2021新片精品.*?<ul>(?P<page>.*?)</ul>", re.S)
obj2 = re.compile(r"最新电影下载</a>]<a href='(?P<href>.*?)'>", re.S)
obj3 = re.compile(r'最新电影下载</a>]<a .*?《(?P<name>.*?)》.*?</a>', re.S)
result = obj.finditer(r.text)
child_href_list = []
for i in result:
# print(i.group('page'))
it = i.group('page')
result2 = obj2.finditer(it)
for itt in result2:
child_href = url + itt.group('href').strip('/')
child_href_list.append(child_href)
# 提取子页面内容
for h in child_href_list:
# print(h)
child_resp = requests.get(h)
child_resp.encoding = 'gb2312'
result3 = obj3.search(child_resp.text)
print(h, result3.group('name'))
这个程序获取电影的下载链接和电影的名字,链接没问题,加上名字就出现了一下结果。
运行结果:
'NoneType' object has no attribute 'group'
这是为什么呀?哪位大神帮忙看看,谢谢 调用group的对象是空值,提示狠明显啊 wp231957 发表于 2021-8-21 10:59
调用group的对象是空值,提示狠明显啊
哦,那么空值怎么处理啊?哪里出问题拉? 本帖最后由 nahongyan1997 于 2021-8-21 15:11 编辑
江湖散人 发表于 2021-8-21 14:27
哦,那么空值怎么处理啊?哪里出问题拉?
你也想做网站吗兄嘚
你用的正则表达式不对。 nahongyan1997 发表于 2021-8-21 15:08
你也想做网站吗兄嘚
你用的正则表达式不对。
试试看,跟着视频做的,就是不知道哪出问题了。
不过我已经找到问题了,已经解决了。
网站好做吗? 江湖散人 发表于 2021-8-22 09:56
试试看,跟着视频做的,就是不知道哪出问题了。
不过我已经找到问题了,已经解决了。
网站好做吗?
你得找到一个免费供你电和网络的地方要不然太费钱 nahongyan1997 发表于 2021-8-22 13:30
你得找到一个免费供你电和网络的地方要不然太费钱
在哪可以免费获得网络和电的地方啊?
这是我用get得到的 你的正则写的有问题把 江湖散人 发表于 2021-8-22 17:37
在哪可以免费获得网络和电的地方啊?
我觉得他在忽悠你,并没有 Azeee 发表于 2021-8-22 20:16
这是我用get得到的 你的正则写的有问题把
正则大方向是没问题的,就是中间少了一个空格。已经解决了。谢谢啊 benyazi 发表于 2021-8-22 21:28
我觉得他在忽悠你,并没有
我确实没有遇到,哈哈 江湖散人 发表于 2021-8-22 23:10
我确实没有遇到,哈哈
找个好地方打工,有网有电的那种地方打工,
又能赚钱又能白嫖 nahongyan1997 发表于 2021-8-23 08:50
找个好地方打工,有网有电的那种地方打工,
又能赚钱又能白嫖
能介绍一个吗?{:5_109:} 江湖散人 发表于 2021-8-24 14:33
能介绍一个吗?
来我这啊{:5_95:}
页:
[1]