鱼C论坛

 找回密码
 立即注册
查看: 2009|回复: 2

[已解决]POST表单好像没有正确提交(python)

[复制链接]
发表于 2016-9-16 21:10:27 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import urllib.request
  2. import urllib.parse
  3. from bs4 import BeautifulSoup
  4. import time
  5.   
  6. fs = ''
  7. url = "http://app2.bjepb.gov.cn/cpout/showout/ListAccept.aspx"  
  8. postdata = urllib.parse.urlencode({'_EVENTTARGET':"",
  9. '_EVENTARGUMENT':"",
  10. '_VIEWSTATE':"0VaODZY15P3qOZrMI07a5B4TT0zdOWdZzKAHt0PGEAD1QpUaHiGef4xvkOdq9AeMPCH9MxgqpQ3fUEDmIanoXK+lrexKoT+fnrUVQX9L5Rko8C4jcF3uGooYzx+QBeOkBazikPtl9U41TVaSyCwxvIhV5YZ9DfDy5adLR99njfXc6zBJloXBiTukCH7+4664L0W4IavHQ/I4c8vlD5Cv3bLajBEbxWD8hrpZOBhZzILpUbXGcbFZAvwIf95RUSPeVgvI4uvJbE+m4yi2FLwMJppePbuT1bW0k95k6B7u+NtY0LdW8MQUE2P8JvLuap06W10Y/+4Qsm02KzSr9og6pFDcZ2BXQM2l+zsAv1XrtmNE+0KaTKVpOx8EbGB0GwKjp0Z2EbtKM8G6Nkt/Ep46uInfLZXO7oqf+EvH17EWB3b3HgXHOD7jzeA48rAPU8zH4jN3yAGyve9IBwqthSJyQVhJdOCBhKMi+qTpVIp0GSXYxbcC7KGYyo7JX+kmZNfcvZk36pw7nrzdzHOXc7jZkmbxxee9qEdq9Mx91ftliQYGLm22Qs9WYOP53wQRRJLqnjlcbdHBRLCFz8uKVjQKtMgetw+So1sKWYWCdUTHuxzaKv2niaJWxnQOrtOMWKEdIR/3O1Y1h12EWxdyvTddU0hBocGT2kjGWnYMSQATpKhiRhZWkyqoLTvAeeIQT/kwX9ZK/uYka2I1TxQA8iDA3G2JCplj7oCEJeWzQXkj2/feBFbTpx/4Mpe82IB8Lt2R9+SnEeMfPmK8BXSuC2izk2L7jwGm2Hs7qMyjb/b97bEnmyBHSYefW71dNLZZA+vz5fTFRpesQiRxxHbW1d2VgMKnoEdHmEjMhWYX9MnNRbv2YMY455YaD4gl8KcPcEDqfs/RK5+xJCh2x8R0ex8sP1kFLv7oS5pNe+JD5bY2zhIp93RFttZSJA6w8Kl++CC2+R9cU9xMslC3z0izWS1Qg9Ejg/FH0fGChTR+t2fHsx8MIflpMir+U6Fx3gpObyN2YolyAWGOyNlPLWxELh3IMJQfK6F5eC3hAwZnlHJ0brwYGkJxsrUBe8BIqYJUiFjx",
  11. 'ddlcounty':"市级",
  12. 'txtAppName': "",'AspNetPager_input': '5', 'AspNetPager': '跳转'})  
  13. postdata = postdata.encode('utf-8')
  14. req = urllib.request.Request(url, postdata)
  15. req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:48.0) Gecko/20100101 Firefox/48.0')
  16. time.sleep(1.5)
  17. res = urllib.request.urlopen(req)
  18. html=res.read().decode('utf-8')
  19. print(res.status, res.reason)  
  20.   
  21. if( res.status != 200 ):  
  22.     exit()  
  23.   
  24. print('ok')

  25. soup=BeautifulSoup(html,'html.parser')
  26. trs=str(soup) #根据表格的style来定位表格,也可以通过id和第几个来定位,请参考函数重载
  27. fs=fs+trs
  28. res.close()



  29. f=open(r'C:/temp/group1.txt','w',encoding='utf-8') #这个例子没有写新建文件的语句,需要自己提前在相应目录建好空文件,才能通过
  30. f.write(fs)
  31. f.close
  32.   
复制代码

总是显示第一页,无法跳转到第五页,好像POST表单没有提交,请各位大神帮帮小弟!!!谢谢,谢谢
最佳答案
2016-9-16 23:20:08
一个简单例子,自己完善吧~
这个页面的 字符集 设置得有些蛋疼~

  • import re
  • import requests as req
  • url = r'http://app2.bjepb.gov.cn/cpout/showout/ListAccept.aspx'
  • UA = {'User-Agent':'Mozilla/5.0'}
  • formdata = {
  •     '__EVENTTARGET':"",
  •     '__EVENTARGUMENT':"",
  •     '__VIEWSTATE':'',
  •     'ddlcounty':"市级",
  •     'txtAppName': "",
  •     'AspNetPager_input': '5',
  •     'AspNetPager': '跳转'
  • }
  • ssn = req.Session()
  • ssn.headers = UA
  • rsp = ssn.get(url)
  • html = rsp.text
  • vs = re.findall(r'<input[^>]+?name="__VIEWSTATE"[^>]+?value="([^"]+)',html)[0]
  • formdata['__VIEWSTATE'] = vs
  • rsp = ssn.post(url, data=formdata)
  • html = rsp.text
  • pg = ''.join(re.findall(r'(当前页:).+?(\d+)',html, re.S)[0])
  • print(pg)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-9-16 23:20:08 | 显示全部楼层    本楼为最佳答案   
一个简单例子,自己完善吧~
这个页面的 字符集 设置得有些蛋疼~

  • import re
  • import requests as req
  • url = r'http://app2.bjepb.gov.cn/cpout/showout/ListAccept.aspx'
  • UA = {'User-Agent':'Mozilla/5.0'}
  • formdata = {
  •     '__EVENTTARGET':"",
  •     '__EVENTARGUMENT':"",
  •     '__VIEWSTATE':'',
  •     'ddlcounty':"市级",
  •     'txtAppName': "",
  •     'AspNetPager_input': '5',
  •     'AspNetPager': '跳转'
  • }
  • ssn = req.Session()
  • ssn.headers = UA
  • rsp = ssn.get(url)
  • html = rsp.text
  • vs = re.findall(r'<input[^>]+?name="__VIEWSTATE"[^>]+?value="([^"]+)',html)[0]
  • formdata['__VIEWSTATE'] = vs
  • rsp = ssn.post(url, data=formdata)
  • html = rsp.text
  • pg = ''.join(re.findall(r'(当前页:).+?(\d+)',html, re.S)[0])
  • print(pg)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-9-17 10:00:33 | 显示全部楼层
多谢大神!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-6-2 04:43

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表