python 爬取百度云盘资源,萌新交流区,萌新训练营,鱼C论坛

小小大鱼 发表于 2016-1-28 10:03:25

python 爬取百度云盘资源

本帖最后由小小大鱼于 2016-3-21 23:17 编辑

ps:其中部分代码来自网络，至于是谁的我自己也不清楚了......

第一次发分享贴，也来个隐藏 ^_^

废话不多说，直接上代码(目前功能相当简陋，需要的可以自己修改了，欢迎交流)

本脚本已经更新2.0版本：传送门：http://bbs.fishc.com/thread-70206-1-1.html

#coding = utf-8
import urllib,urllib.request
import webbrowser
import re

def yunpanSearch(key):

keyword=key
keyword=keyword.encode('utf-8')
keyword=urllib.request.quote(keyword)
url="http://www.wangpansou.cn/s.php?q="+keyword+"&wp=0&start=0"

req=urllib.request.Request(url, headers = {
'Connection': 'Keep-Alive',
'Accept': 'text/html, application/xhtml+xml, */*',
   'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'
})

opener=urllib.request.urlopen(req)
html=opener.read().decode('utf-8')
p=re.compile(r'https?://pan.baidu.com.*\?uk={10}.*[\d+?]"')
source=p.findall(html)

if source!='':
   print('\n 爬取成功，链接如下：! \n')
   for i in source:
         print(i)
else:
   print('\n 爬虫迷路了!')

if __name__ == '__main__':
print('爬取百度云盘资源快捷爬取')
key = input('输入你想搜索的资源:\n')
yunpanSearch(key)

独殇狼 发表于 2016-1-28 11:31:00

支持楼主。

汇编学习57210 发表于 2016-1-28 13:46:25

好高深，刚来，膜拜~

甲鱼发表于 2016-1-28 15:44:02

看看

小云子墨 发表于 2016-1-28 17:50:43

谢谢楼主分享

小邪发表于 2016-1-28 17:57:54

{:10_280:}

★简★ 发表于 2016-1-30 01:58:43

学习学习~

阔怀发表于 2016-1-30 16:11:30

厉害

DingRan 发表于 2016-1-31 11:31:10

学习一下

清风无痕 发表于 2016-1-31 12:14:41

学习学习~

乖乖仔GX 发表于 2016-1-31 15:27:22

看看

sunshineyilan 发表于 2016-1-31 15:29:36

废话不多说，直接上代码

youliyuan2005 发表于 2016-1-31 15:54:40

感谢分享

hanchar 发表于 2016-1-31 22:12:50

看看看看

meducn 发表于 2016-2-1 09:02:01

支持楼主

幽默的仁者 发表于 2016-2-1 14:06:37

看看，有没可学的

a506136969 发表于 2016-2-1 23:15:59

看看咯

65230215 发表于 2016-2-2 00:48:49

看看

agent 发表于 2016-2-2 08:38:05

我看的只能返回5条结果，不知道这个是不是。

z379652501 发表于 2016-2-2 10:46:19

楼主叼！

页: [1] 2 3 4 5 6

鱼C论坛's Archiver

python 爬取百度云盘资源