鱼C论坛

 找回密码
 立即注册
查看: 2684|回复: 13

[已解决]爬取图片时遇到了一点问题 请各位大佬指点

[复制链接]
回帖奖励 1 鱼币 回复本帖可获得 1 鱼币奖励! 每人限 1 次(中奖概率 50%)
发表于 2019-4-17 16:03:02 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import urllib.request
  2. import os
  3. import re
  4. import random




  5. def urlopen(url):
  6.     req = urllib.request.Request(url)
  7.     req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6823.400 QQBrowser/10.3.3117.400')

  8.     proxies = ['124.152.32.140:53281', '163.125.157.53:8888', '163.125.157.49:8888']
  9.     proxy = random.choice(proxies)

  10.     proxy_support = urllib.request.ProxyHandler({'http':proxy})
  11.     opener = urllib.request.build_opener(proxy_support)
  12.     urllib.request.install_opener(opener)

  13.     html = urllib.request.urlopen(req)
  14.     html = html.read()
  15.     return html

  16. def zhuyao(html):
  17.     p = r'<img class="lazy" src="(https://i.meizitu.net/thumbs/\d\d\d\d/\d\d/.+?.jpg)"'
  18.     tupian = re.findall(p,html)
  19.     for each in tupian:
  20.         wjm = each.split('/')[-1]
  21.         tp = urlopen(tupian)
  22.         with open(wjm,'wb') as f:
  23.             f.write(tp)
  24.    
  25. if __name__=='__main__':
  26.     url = 'https://www.mzitu.com/xinggan/'
  27.     os.mkdir('妹子图片')
  28.     os.chdir('妹子图片')
  29.     zhuyao(urlopen(url))
复制代码




回溯(最近一次调用last):

文件“C: \用户桌面\ \ tx \妹子图片爬取。,第37行,在中

zhuyao (urlopen (url))

文件“C: \用户桌面\ \ tx \妹子图片爬取。26行,朱瑶

图皮人的= re.findall (p, html)

文件C: \ Python3.7.2 \ lib \再保险。findall中的第223行

返回_compile(模式、旗帜).findall(字符串)

类型错误:不能在类字节码对象上使用字符串模式

这是错误原因  看不太懂
最佳答案
2019-4-17 16:08:32
你这错误信息咋都变成中文了呢  还不如英文(E文还能猜一猜是啥意思,这个中文反到是一点都不懂了——)
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-4-17 16:08:32 | 显示全部楼层    本楼为最佳答案   
你这错误信息咋都变成中文了呢  还不如英文(E文还能猜一猜是啥意思,这个中文反到是一点都不懂了——)
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-4-17 16:10:39 | 显示全部楼层
已经找到问题了  解决了。。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-6 18:36:24 | 显示全部楼层

回帖奖励 +1 鱼币

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-7 09:03:59 | 显示全部楼层

回帖奖励 +1 鱼币

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-7 14:59:06 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-10 20:35:59 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-11 10:50:31 | 显示全部楼层

回帖奖励 +1 鱼币

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-12 21:17:13 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-23 15:32:31 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-23 15:33:21 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-23 15:33:54 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-23 15:39:02 | 显示全部楼层

回帖奖励 +1 鱼币

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-28 21:16:16 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-29 04:56

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表