python 爬取百度云盘资源

小小大鱼 · 发表于 2016-1-28 10:03:25

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由小小大鱼于 2016-3-21 23:17 编辑

ps:其中部分代码来自网络，至于是谁的我自己也不清楚了......

第一次发分享贴，也来个隐藏 ^_^

废话不多说，直接上代码(目前功能相当简陋，需要的可以自己修改了，欢迎交流)

本脚本已经更新2.0版本：传送门：http://bbs.fishc.com/thread-70206-1-1.html

#coding = utf-8
import urllib,urllib.request
import webbrowser
import re
def yunpanSearch(key):
keyword=key
keyword=keyword.encode('utf-8')
keyword=urllib.request.quote(keyword)
url="http://www.wangpansou.cn/s.php?q="+keyword+"&wp=0&start=0"
req=urllib.request.Request(url, headers = {
'Connection': 'Keep-Alive',
'Accept': 'text/html, application/xhtml+xml, */*',
'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'
})
opener=urllib.request.urlopen(req)
html=opener.read().decode('utf-8')
p=re.compile(r'https?://pan.baidu.com.*\?uk=[0-9]{10}.*[\d+?]"')
source=p.findall(html)
if source!='':
print('\n 爬取成功，链接如下：! \n')
for i in source:
print(i)
else:
print('\n 爬虫迷路了!')
if __name__ == '__main__':
print('爬取百度云盘资源快捷爬取')
key = input('输入你想搜索的资源:\n')
yunpanSearch(key)

复制代码

独殇狼 · 发表于 2016-1-28 11:31:00

支持楼主。

汇编学习57210 · 发表于 2016-1-28 13:46:25

好高深，刚来，膜拜~

甲鱼 · 发表于 2016-1-28 15:44:02

看看

小云子墨 · 发表于 2016-1-28 17:50:43

谢谢楼主分享

小邪 · 发表于 2016-1-28 17:57:54

★简★ · 发表于 2016-1-30 01:58:43

学习学习~

阔怀 · 发表于 2016-1-30 16:11:30

厉害

DingRan · 发表于 2016-1-31 11:31:10

学习一下

清风无痕 · 发表于 2016-1-31 12:14:41

学习学习~

乖乖仔GX · 发表于 2016-1-31 15:27:22

看看

sunshineyilan · 发表于 2016-1-31 15:29:36

废话不多说，直接上代码

youliyuan2005 · 发表于 2016-1-31 15:54:40

感谢分享

hanchar · 发表于 2016-1-31 22:12:50

看看看看

meducn · 发表于 2016-2-1 09:02:01

支持楼主

幽默的仁者 · 发表于 2016-2-1 14:06:37

看看，有没可学的

a506136969 · 发表于 2016-2-1 23:15:59

看看咯

65230215 · 发表于 2016-2-2 00:48:49

看看

agent · 发表于 2016-2-2 08:38:05

我看的只能返回5条结果，不知道这个是不是。

z379652501 · 发表于 2016-2-2 10:46:19

楼主叼！

账号		自动登录	找回密码
密码			立即注册

[作品展示] python 爬取百度云盘资源