[已解决]urllib执行后IDLE什么都不出现是为什么呢？

326533970 · 发表于 2016-12-29 21:03:51

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

#python 3.5.2
import urllib.request, os
def urlopen(url):
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36')
resp=urllib.request.urlopen(url)
html=resp.read()
return html
def get_page(url):
html=urlopen(url).decode('utf-8')
urlopen()

复制代码

永远是如图所示要怎么整？
urllib.request模块要怎么替换一个新的才行？
只要import urllib.request一句就足以这样了

最佳答案

月排行榜 / 总排行榜

玄夜Python之路

2017-1-3 18:31:14

你是做爬取图片爬虫吗？你的函数写错了

匹配模块有BeautifulSoup和re，而不是你所写的 .find() 。

python中find的函数的功能是查找指定的字符串并返回该字符串的起始位置。

函数原型：find(str, pos_start, pos_end)

参数如下：

str:被查找“字符串”

pos_start:查找的首字母位置（从0开始计数。默认：0）

pos_end: 查找的末尾位置（默认-1）

返回值：如果查到：返回查找的第一个出现的位置。否则，返回-1。

爬虫之查找内容：
方法一：from bs4 import BeautifulSoup
soup = BeautifulSoup(html,'html.parser')
img_url = soup.find('img').get('src') #匹配图片url
imgs = soup.find_all('img') #匹配所有的图片

方法二：import re
reg = r'src="(.+?\.jpg)" '
img = re.compile(reg)
imgs = re.findall(img, html) #匹配所有的图片

跳转到最佳答案楼层

hldh214 · 发表于 2016-12-30 10:12:34

print(urlopen())

复制代码

玄夜Python之路 · 发表于 2016-12-30 17:17:57

你没有传参

326533970 · 发表于 2016-12-31 16:53:10

本帖最后由 326533970 于 2016-12-31 16:56 编辑

玄夜Python之路发表于 2016-12-30 17:17
你没有传参

不是的这里连‘>>>’都没有还有我只import urllib.request 之后也一样

#python3.5.2
import urllib.request
import os
def url_open(url):
req=urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36')
resp=urllib.request.urlopen(url)
html=resp.read()
return html
def get_page(url):
html=url_open(url).decode('utf-8')
a= html.find('current-comment-page') + 23#.find是从搜索的第一个字符开始计算的包括'<之类的
b= html.find(']',a)
h=html[a:b]
return html[a:b]
def find_imgs(url):
html=url_open(url).decode('utf-8')
img_addrs=[]
a=html.find('img src=')
while a != -1:
b= html.find('.jpg',a,a+255)
if b!= -1:
img_addrs.append(html[a+9:b+4])
else:
b=a+9
a= html.find('img src=',b)
return img_addrs
def save_imgs(folder, img_addrs):
for each in img_addrs:
filename=each.split('/')[-1]
with open(filename,'wb')as f:
img = url_open(each)
f.write(img)
def download_mm(folder='ooxx',pages=50):
url='http://jandan.net/ooxx'
a=os.getcwd()
'''if not os.path.exits(a):
path=a+os.sep+folder
os.mkdir(path)
else:
path=a+os.sep+folder
os.chdir(path)'''
os.mkdir(folder)
os.chdir(folder)
page_num = int(get_page(url))
for i in range(pages):
page_num-=i
page_url=url+'page-'+str(page_num)+'#comments'
img_addrs=find_imgs(page_url)
save_imgs(folder,img_addrs)
if __name__='__main__':
download_mm()

复制代码

按F5之后
就是如上图的样子

326533970 · 发表于 2016-12-31 16:57:35

hldh214 发表于 2016-12-30 10:12

不是的这里连‘>>>’都没有还有我只import urllib.request 之后也一样

#python3.5.2
import urllib.request
import os
def url_open(url):
req=urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36')
resp=urllib.request.urlopen(url)
html=resp.read()
return html
def get_page(url):
html=url_open(url).decode('utf-8')
a= html.find('current-comment-page') + 23#.find是从搜索的第一个字符开始计算的包括'<之类的
b= html.find(']',a)
h=html[a:b]
return html[a:b]
def find_imgs(url):
html=url_open(url).decode('utf-8')
img_addrs=[]
a=html.find('img src=')
while a != -1:
b= html.find('.jpg',a,a+255)
if b!= -1:
img_addrs.append(html[a+9:b+4])
else:
b=a+9
a= html.find('img src=',b)
return img_addrs
def save_imgs(folder, img_addrs):
for each in img_addrs:
filename=each.split('/')[-1]
with open(filename,'wb')as f:
img = url_open(each)
f.write(img)
def download_mm(folder='ooxx',pages=50):
url='http://jandan.net/ooxx'
a=os.getcwd()
'''if not os.path.exits(a):
path=a+os.sep+folder
os.mkdir(path)
else:
path=a+os.sep+folder
os.chdir(path)'''
os.mkdir(folder)
os.chdir(folder)
page_num = int(get_page(url))
for i in range(pages):
page_num-=i
page_url=url+'page-'+str(page_num)+'#comments'
img_addrs=find_imgs(page_url)
save_imgs(folder,img_addrs)
if __name__='__main__':
download_mm()

复制代码

按F5之后
就是如上图的样子

调皮的小屌 · 发表于 2017-1-1 22:55:34

print（）打印出来

玄夜Python之路 · 发表于 2017-1-3 18:31:14

这个最佳答案由玄夜Python之路给出，感谢玄夜Python之路的回答。

单击隐藏图章

你是做爬取图片爬虫吗？你的函数写错了

匹配模块有BeautifulSoup和re，而不是你所写的 .find() 。

python中find的函数的功能是查找指定的字符串并返回该字符串的起始位置。

函数原型：find(str, pos_start, pos_end)

参数如下：

str:被查找“字符串”

pos_start:查找的首字母位置（从0开始计数。默认：0）

pos_end: 查找的末尾位置（默认-1）

返回值：如果查到：返回查找的第一个出现的位置。否则，返回-1。

爬虫之查找内容：
方法一：from bs4 import BeautifulSoup
soup = BeautifulSoup(html,'html.parser')
img_url = soup.find('img').get('src') #匹配图片url
imgs = soup.find_all('img') #匹配所有的图片

方法二：import re
reg = r'src="(.+?\.jpg)" '
img = re.compile(reg)
imgs = re.findall(img, html) #匹配所有的图片

账号		自动登录	找回密码
密码			立即注册

[已解决]urllib执行后IDLE什么都不出现是为什么呢？

马上注册，结交更多好友，享用更多功能^_^

评分