python 爬取百度云盘资源
本帖最后由 小小大鱼 于 2016-3-21 23:17 编辑ps:其中部分代码来自网络 ,至于是谁的我自己也不清楚了......
第一次发分享贴,也来个隐藏 ^_^
废话不多说,直接上代码(目前功能相当简陋,需要的可以自己修改了,欢迎交流)
本脚本已经更新2.0版本:传送门:http://bbs.fishc.com/thread-70206-1-1.html
#coding = utf-8
import urllib,urllib.request
import webbrowser
import re
def yunpanSearch(key):
keyword=key
keyword=keyword.encode('utf-8')
keyword=urllib.request.quote(keyword)
url="http://www.wangpansou.cn/s.php?q="+keyword+"&wp=0&start=0"
req=urllib.request.Request(url, headers = {
'Connection': 'Keep-Alive',
'Accept': 'text/html, application/xhtml+xml, */*',
'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'
})
opener=urllib.request.urlopen(req)
html=opener.read().decode('utf-8')
p=re.compile(r'https?://pan.baidu.com.*\?uk={10}.*[\d+?]"')
source=p.findall(html)
if source!='':
print('\n 爬取成功,链接如下:! \n')
for i in source:
print(i)
else:
print('\n 爬虫迷路了!')
if __name__ == '__main__':
print('爬取百度云盘资源快捷爬取')
key = input('输入你想搜索的资源:\n')
yunpanSearch(key)
支持楼主。 好高深,刚来,膜拜~ 看看 谢谢楼主分享 {:10_280:} 学习学习~ 厉害 学习一下 学习学习~ 看看 废话不多说,直接上代码 感谢分享 看看看看 支持楼主
看看,有没可学的 看看咯 看看 我看的只能返回5条结果,不知道这个是不是。 楼主叼!