论一只爬虫的自我修养60 为什么我没法输出那些网址但是也不报错

ppp111 · 发表于 2016-10-31 19:25:12

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由 ppp111 于 2016-10-31 23:00 编辑

正则表达式4 为什么我没法输出那些网址
我模仿小甲鱼老师写的代码运行后是
C:\Users\Administrator\Desktop\工作夹\python\python.exe C:/Users/Administrator/PycharmProjects/untitled/meizitu.py

Process finished with exit code 0 然后就什么也没有了代码如下问题出在哪里呢

import re
import urllib.request
def open_url(url):
req = urllib.request.Request(url)
req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')
page = urllib.request.urlopen(req)
html = page.read().decode('utf-8')
return html
def get_img(html):
p = r'<img class="BDE_Image" src="[^"]+\.jpg"'
imglist = re.findall(p, html)
for each in imglist:
print(each)
if __name__ == '__mian__':
url = 'http://tieba.baidu.com/p/3563409202'
get_img(open_url(url))

复制代码

hldh214 · 发表于 2016-11-1 10:56:05

因为你的正则不匹配

ppp111 · 发表于 2016-11-2 20:42:02

hldh214 发表于 2016-11-1 10:56
因为你的正则不匹配

不要一看就嘴巴说说你说之前你得去试试啊我自己找到BUG了第19行 if __name__ == '__mian__': 应该是 if __name__ == '__main__': 这样就可以运行了

hldh214 · 发表于 2016-11-3 10:57:08

ppp111 发表于 2016-11-2 20:42
不要一看就嘴巴说说你说之前你得去试试啊我自己找到BUG了第19行 if __name__ == '__m ...

下个 id 见咯

账号		自动登录	找回密码
密码			立即注册

论一只爬虫的自我修养60 为什么我没法输出那些网址 但是也不报错

马上注册，结交更多好友，享用更多功能^_^

论一只爬虫的自我修养60 为什么我没法输出那些网址但是也不报错