|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
- import re, requests
- url = 'https://www.dytt8.net/'
- r = requests.get(url)
- r.encoding = 'gb2312' # 对返回的内容进行解码,charset=gb2312
- # print(r.text)
- obj = re.compile(r"2021新片精品.*?<ul>(?P<page>.*?)</ul>", re.S)
- obj2 = re.compile(r"最新电影下载</a>]<a href='(?P<href>.*?)'>", re.S)
- obj3 = re.compile(r'最新电影下载</a>]<a .*?《(?P<name>.*?)》.*?</a>', re.S)
- result = obj.finditer(r.text)
- child_href_list = []
- for i in result:
- # print(i.group('page'))
- it = i.group('page')
- result2 = obj2.finditer(it)
- for itt in result2:
- child_href = url + itt.group('href').strip('/')
- child_href_list.append(child_href)
- # 提取子页面内容
- for h in child_href_list:
- # print(h)
- child_resp = requests.get(h)
- child_resp.encoding = 'gb2312'
- result3 = obj3.search(child_resp.text)
- print(h, result3.group('name'))
复制代码
这个程序获取电影的下载链接和电影的名字,链接没问题,加上名字就出现了一下结果。
运行结果:
'NoneType' object has no attribute 'group'
这是为什么呀?哪位大神帮忙看看,谢谢 |
|