[已解决]爬虫遇到问题请大神们赐教

Josepy · 发表于 2016-6-7 12:52:54

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import re
import urllib

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html

getHtml('http://tieba.baidu.com/p/4443386473')

Traceback (most recent call last):
File "C:/Users/Administrator/AppData/Local/Programs/Python/Python35-32/getjpg.py", line 11, in <module>
getHtml('http://tieba.baidu.com/p/4443386473')
File "C:/Users/Administrator/AppData/Local/Programs/Python/Python35-32/getjpg.py", line 7, in getHtml
page = urllib.urlopen(url)
AttributeError: module 'urllib' has no attribute 'urlopen'

最佳答案

月排行榜 / 总排行榜

梦里不知身是客

2016-6-7 14:07:51

楼上正解，python3.X以后，要 import urllib.request 才能使用
import urllib.request
def getHtml(url):
   page = urllib.request.urlopen(url)
   html = page.read()
   return html

getHtml('http://www.baidu.com')

跳转到最佳答案楼层

WylLy · 发表于 2016-6-7 13:56:16

应该导入的是

import urllib.request

复制代码

梦里不知身是客 · 发表于 2016-6-7 14:07:51

楼上正解，python3.X以后，要 import urllib.request 才能使用
import urllib.request
def getHtml(url):
   page = urllib.request.urlopen(url)
   html = page.read()
   return html

getHtml('http://www.baidu.com')

Andriy · 发表于 2016-6-7 14:39:35

python3.X后，urlib,urlib2合并了。
import urllib.request

def getHtml(url):
page = urllib.request.urlopen(url)
html = page.read()
return html

账号		自动登录	找回密码
密码			立即注册