|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
以下是我写的代码
import re
import urllib.request as ur
url='http://tieba.baidu.com/p/1753935195'
#打开网页
def open_url(url):
req=ur.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36')
a=ur.urlopen(req)
html=a.read().decode('utf-8')
return html
#获得图片地址
def get_img(html):
img=r'"BDE_Image" src="([^"]+\.jpg)'
imglist=re.findall(img,html)
for i in imglist:
if i:
yield print(i)
else:
continue
if __name__=='__main__':
url='https://tieba.baidu.com/p/1753935195'
get_img(open_url)
程序可以运行 但是不显示任何东西 .
想测试看看获取图片地址。
顺便问一下 下面这个地址从哪儿查看的 实不相瞒 这是我复制另外一个 大佬的代码地址 开始以为是自己地址错了 但是用这个地址还是不行
url='https://tieba.baidu.com/p/1753935195'
求大佬们相助
!!!!!
万分感谢
本帖最后由 lixiangyv 于 2020-1-6 19:57 编辑
然后在这行 : yield print(i)
不可以使用 yield , 要把 yield 删掉,他后面不能是函数!
这样在我的机子上是木有任何错误了。
正常打打印了:
正确源代码:
- import re
- import urllib.request as ur
- url='http://tieba.baidu.com/p/1753935195'
- #打开网页
- def open_url(url):
- req=ur.Request(url)
- req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36')
- a=ur.urlopen(req)
- html=a.read().decode('utf-8')
- return html
- #获得图片地址
- def get_img(html):
- img=r'"BDE_Image" src="([^"]+\.jpg)'
- imglist=re.findall(img,html)
- for i in imglist:
- if i:
- print(i)
- else:
- continue
- if __name__=='__main__':
- url='https://tieba.baidu.com/p/1753935195'
- get_img(open_url(url))
复制代码
|
|