[已解决]用multiprocessing爬取视频没反应

今天的我更强了 · 发表于 2020-8-16 14:30:31

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

代码如下：
import os
os.chdir('..\\第十四章\\第十五章')
from multiprocessing import Pool
import requests
def demo(i):
url='https://youku.cdn4-okzy.com/20200731/9301_08b1b217/1000k/hls/1af43c99c22000%03d.ts'%i
print(url)
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}
response=requests.get(url,headers=headers)
with open('{}'.format(url[-20:]),'wb') as f:
f.write(response.content)
if __name__=='__main__':
os.mkdir('如此美好')
os.chdir('如此美好')
pool=Pool(20)
for i in range(668):
pool.apply_async(demo,(i,))
pool.close()
pool.join()
爬取爱奇艺的如此美好的我们，为什么没有反应？就感觉陷入无限循环中一样，问题出在哪里？有没有大佬知道，求解

最佳答案

月排行榜 / 总排行榜

suchocolate

2020-8-16 15:27:24

本帖最后由 suchocolate 于 2020-8-16 15:36 编辑

用你的代码下载正常，我只是改了文件和文件夹名称。

import os
from multiprocessing import Pool
import requests
def demo(act_i):
url = 'https://youku.cdn4-okzy.com/20200731/9301_08b1b217/1000k/hls/1af43c99c22000%03d.ts' % act_i
print(url)
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}
response = requests.get(url, headers=headers)
v_name = url.split('/')[-1]
with open(v_name, 'wb') as f:
f.write(response.content)
if __name__ == '__main__':
if not os.path.exists('test'):
os.mkdir('test')
os.chdir('test')
pool = Pool(20)
for i in range(50):
pool.apply_async(demo, (i,))
pool.close()
pool.join()

复制代码

跳转到最佳答案楼层

suchocolate · 发表于 2020-8-16 15:27:24

这个最佳答案由 suchocolate 给出，感谢 suchocolate 的回答。

单击隐藏图章

本帖最后由 suchocolate 于 2020-8-16 15:36 编辑

用你的代码下载正常，我只是改了文件和文件夹名称。

import os
from multiprocessing import Pool
import requests
def demo(act_i):
url = 'https://youku.cdn4-okzy.com/20200731/9301_08b1b217/1000k/hls/1af43c99c22000%03d.ts' % act_i
print(url)
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}
response = requests.get(url, headers=headers)
v_name = url.split('/')[-1]
with open(v_name, 'wb') as f:
f.write(response.content)
if __name__ == '__main__':
if not os.path.exists('test'):
os.mkdir('test')
os.chdir('test')
pool = Pool(20)
for i in range(50):
pool.apply_async(demo, (i,))
pool.close()
pool.join()

复制代码

今天的我更强了 · 发表于 2020-8-16 15:52:42

suchocolate 发表于 2020-8-16 15:27
用你的代码下载正常，我只是改了文件和文件夹名称。

好的谢谢可以了请问您知道为什么我打开爱奇艺电视剧不同集数的网址到解析网站解析之后却是同一集嘛？

suchocolate · 发表于 2020-8-16 15:57:51

今天的我更强了发表于 2020-8-16 15:52
好的谢谢可以了请问您知道为什么我打开爱奇艺电视剧不同集数的网址到解析网站解析之后却是同一集嘛？

需要结合具体url分析，网址是什么？

今天的我更强了 · 发表于 2020-8-16 16:04:14

suchocolate 发表于 2020-8-16 15:57
需要结合具体url分析，网址是什么？

就是爱奇艺里如此美好的我们 1--16 集能麻烦您搜一下吗

账号		自动登录	找回密码
密码			立即注册

[已解决]用multiprocessing爬取视频没反应

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块