小小大鱼 发表于 2016-1-28 10:03:25

python 爬取百度云盘资源

本帖最后由 小小大鱼 于 2016-3-21 23:17 编辑

ps:其中部分代码来自网络 ,至于是谁的我自己也不清楚了......

第一次发分享贴,也来个隐藏 ^_^

废话不多说,直接上代码(目前功能相当简陋,需要的可以自己修改了,欢迎交流)


本脚本已经更新2.0版本:传送门:http://bbs.fishc.com/thread-70206-1-1.html

#coding = utf-8
import urllib,urllib.request
import webbrowser
import re


def yunpanSearch(key):

    keyword=key
    keyword=keyword.encode('utf-8')
    keyword=urllib.request.quote(keyword)
    url="http://www.wangpansou.cn/s.php?q="+keyword+"&wp=0&start=0"

    req=urllib.request.Request(url, headers = {
            'Connection': 'Keep-Alive',
            'Accept': 'text/html, application/xhtml+xml, */*',
           'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',
            'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'
    })
   
    opener=urllib.request.urlopen(req)
    html=opener.read().decode('utf-8')
    p=re.compile(r'https?://pan.baidu.com.*\?uk={10}.*[\d+?]"')
    source=p.findall(html)


    if source!='':
      print('\n 爬取成功,链接如下:! \n')
      for i in source:
            print(i)
    else:
      print('\n 爬虫迷路了!')


if __name__ == '__main__':
    print('爬取百度云盘资源快捷爬取')
    key = input('输入你想搜索的资源:\n')
    yunpanSearch(key)

独殇狼 发表于 2016-1-28 11:31:00

支持楼主。

汇编学习57210 发表于 2016-1-28 13:46:25

好高深,刚来,膜拜~

甲鱼 发表于 2016-1-28 15:44:02

看看

小云子墨 发表于 2016-1-28 17:50:43

谢谢楼主分享

小邪 发表于 2016-1-28 17:57:54

{:10_280:}

★简★ 发表于 2016-1-30 01:58:43

学习学习~

阔怀 发表于 2016-1-30 16:11:30

厉害

DingRan 发表于 2016-1-31 11:31:10

学习一下

清风无痕 发表于 2016-1-31 12:14:41

学习学习~

乖乖仔GX 发表于 2016-1-31 15:27:22

看看

sunshineyilan 发表于 2016-1-31 15:29:36

废话不多说,直接上代码

youliyuan2005 发表于 2016-1-31 15:54:40

感谢分享

hanchar 发表于 2016-1-31 22:12:50

看看看看

meducn 发表于 2016-2-1 09:02:01

支持楼主

幽默的仁者 发表于 2016-2-1 14:06:37


看看,有没可学的

a506136969 发表于 2016-2-1 23:15:59

看看咯

65230215 发表于 2016-2-2 00:48:49

看看

agent 发表于 2016-2-2 08:38:05

我看的只能返回5条结果,不知道这个是不是。

z379652501 发表于 2016-2-2 10:46:19

楼主叼!
页: [1] 2 3 4 5 6
查看完整版本: python 爬取百度云盘资源