鱼C论坛

 找回密码
 立即注册
查看: 2181|回复: 3

[已解决]爬虫遇到问题请大神们赐教

[复制链接]
发表于 2016-6-7 12:52:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import re
import urllib



def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

getHtml('http://tieba.baidu.com/p/4443386473')




Traceback (most recent call last):
  File "C:/Users/Administrator/AppData/Local/Programs/Python/Python35-32/getjpg.py", line 11, in <module>
    getHtml('http://tieba.baidu.com/p/4443386473')
  File "C:/Users/Administrator/AppData/Local/Programs/Python/Python35-32/getjpg.py", line 7, in getHtml
    page = urllib.urlopen(url)
AttributeError: module 'urllib' has no attribute 'urlopen'
最佳答案
2016-6-7 14:07:51
楼上正解,python3.X以后,要 import urllib.request 才能使用
import urllib.request
def getHtml(url):
     page = urllib.request.urlopen(url)
     html = page.read()
     return html

getHtml('http://www.baidu.com')
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2016-6-7 13:56:16 | 显示全部楼层
应该导入的是
  1. import urllib.request
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-6-7 14:07:51 | 显示全部楼层    本楼为最佳答案   
楼上正解,python3.X以后,要 import urllib.request 才能使用
import urllib.request
def getHtml(url):
     page = urllib.request.urlopen(url)
     html = page.read()
     return html

getHtml('http://www.baidu.com')
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-6-7 14:39:35 | 显示全部楼层
python3.X后,urlib,urlib2合并了。
import urllib.request

def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    return html
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-21 07:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表