小虾米2 发表于 2020-6-4 15:48:20

python3可以采集flash格式的数据吗

类似这个网站http://jgsb.agri.cn/controller?SERVICE_ID=REGISTRY_JCSJ_MRHQ_SHOW_SERVICE&recordperpage=15&newsearch=true&login_result_sign=nologin

Twilight6 发表于 2020-6-4 17:45:30

Flash 里面显示的数据都是从其他地址接口获取的,你找到对应地址就可以采集了吧

zwhe 发表于 2020-6-6 10:42:58

{:10_256:}

suchocolate 发表于 2020-6-6 15:23:02

可以。用requests+re:
import requests
import re

url = 'http://jgsb.agri.cn/controller?SERVICE_ID=REGISTRY_JCSJ_MRHQ_SHOW_SERVICE&recordperpage=15&newsearch=true&login_result_sign=nologin'
headers = {'user-agent': 'firefox'}
r = requests.get(url, headers=headers)
result = re.findall(r'param name="movie" value="\./(.*)"', r.text)
result = 'http://jgsb.agri.cn/' + result
print(result)
r = requests.get(result,headers=headers)
with open('test.swf','wb') as f:
    f.write(r.content)
print('下载完成:test.swf')

小虾米2 发表于 2020-6-10 11:42:18

suchocolate 发表于 2020-6-6 15:23
可以。用requests+re:

下载的是swf格式的文件,里面没有数据啊

小虾米2 发表于 2020-6-10 11:43:42

Twilight6 发表于 2020-6-4 17:45
Flash 里面显示的数据都是从其他地址接口获取的,你找到对应地址就可以采集了吧

有是有,但是接口地址加密了,我没有办法破解

suchocolate 发表于 2020-6-10 12:43:07

本帖最后由 suchocolate 于 2020-6-10 13:34 编辑

小虾米2 发表于 2020-6-10 11:42
下载的是swf格式的文件,里面没有数据啊

我理解错了,没注意你想要的是数据。
你试试这个:https://www.jianshu.com/p/0f3009021fd9
页: [1]
查看完整版本: python3可以采集flash格式的数据吗