鱼C论坛

 找回密码
 立即注册
查看: 1254|回复: 2

[已解决]高手帮看一下,使用python3编写的网络爬虫哪里有问题

[复制链接]
发表于 2018-1-5 08:40:33 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
帮看一下,写的爬虫,不能用,自己新手不是很熟练



import re
import urllib.request

def getHtml(url):
    page = urllib .request.urlopen(url)
    html = page.read()
    print(html)
    return html

def getImg(html):
    reg = r'src="(.*?\.jpg)"'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)

    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'1.jpg')

html = getHtml("https://tieba.baidu.com/p/3740796143#!/l/p1")
print(getImg(html))
最佳答案
2018-1-5 09:32:21
py3环境
import re
import urllib.request

def getHtml(url):
    page = urllib .request.urlopen(url)
    html = page.read()
    # print(html)
    return html

def getImg(html):
    # reg = 'src="(.*?\.jpg)"'
    # imgre = re.compile(reg)
    imglist = re.findall('src="(.*?\.jpg)"',html.decode('utf-8'))

    for imgurl in imglist:
        urllib.request.urlretrieve(imgurl,'1.jpg')

html = getHtml("https://tieba.baidu.com/p/3740796143#!/l/p1")
print(getImg(html))

遇到两个报错:
AttributeError: module 'urllib' has no attribute 'urlretrieve'
通过 urllib.request.urlretrieve() 解决
TypeError: cannot use a string pattern on a bytes-like object
通过 html.decode('utf-8') 解决
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-1-5 09:32:21 | 显示全部楼层    本楼为最佳答案   
py3环境
import re
import urllib.request

def getHtml(url):
    page = urllib .request.urlopen(url)
    html = page.read()
    # print(html)
    return html

def getImg(html):
    # reg = 'src="(.*?\.jpg)"'
    # imgre = re.compile(reg)
    imglist = re.findall('src="(.*?\.jpg)"',html.decode('utf-8'))

    for imgurl in imglist:
        urllib.request.urlretrieve(imgurl,'1.jpg')

html = getHtml("https://tieba.baidu.com/p/3740796143#!/l/p1")
print(getImg(html))

遇到两个报错:
AttributeError: module 'urllib' has no attribute 'urlretrieve'
通过 urllib.request.urlretrieve() 解决
TypeError: cannot use a string pattern on a bytes-like object
通过 html.decode('utf-8') 解决
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-1-5 19:04:01 | 显示全部楼层
谢谢帮助
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-22 10:52

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表