python录入动态网页信息

宇下洞天 · 发表于 2018-11-8 09:20:18

求助背景
我公司内网（局域网，非链接internet）每天需要大量录入信息。各个模块写的很垃圾，有ajax动态网页技术，还有js技术，甚至看到了flash代码的动态网页技术，我想通过用python来完成自动化录入。
实际操作
利用小甲鱼的python爬虫技巧我尝试抓包、发包，但是因为是动态网页技术，爬下来的东西和原网页差距很大，因为水平不高，所以失败了。
我使用selenium的自动化完成了这个工作，但是有个很大的问题，就是公司内网的网站流量特别慢，现在的selenium自动化实际是电脑替代人工完成了网页的打开、录入、提交，但是很多不必要的加载依然会需要加载。
求助问题
在不全部加载整个网页，仅通过抓包、发包的技术，可以完成表单的批量录入吗？

wongyusing · 发表于 2018-11-8 17:49:33

这种看你录入的是表单、数据库还是文件？？
如果仅仅是数据库或表单，动态网页比静态网页容易多了。
用pandas模块就好了。
文件的话，看什么文件吧。

JAY饭 · 发表于 2018-11-14 00:59:06

这是jeery大神之前的帖子，希望有用，我也只用过selenium。
https://fishc.com.cn/thread-83046-1-1.html

账号		自动登录	找回密码
密码			立即注册

python录入动态网页信息

浏览过的版块