鱼C论坛

 找回密码
 立即注册
查看: 3036|回复: 8

如何利用本地Cookie访问淘宝

[复制链接]
发表于 2016-11-22 22:41:12 | 显示全部楼层 |阅读模式
100鱼币
本帖最后由 304079992 于 2016-11-22 22:40 编辑

        想利用本地登录过的Cookie访问淘宝,但是一直没成功,访问豆瓣、百度、鱼C论坛都测试成功
        求大神指点,或有其他方法访问到淘宝请告知,先谢谢了!
  1. import requests
  2. import os
  3. import sqlite3
  4. import win32crypt

  5. def get_chrome_cookies(url):
  6.     os.system('copy "C:\\Users\\Administrator\\AppData\\Local\\Google\\Chrome\\User Data\\Default\\Cookies" D:\\python-chrome-cookies')#复制谷歌浏览器存储Cookie路径到D盘
  7. #处理Cookice
  8.     Cookice = sqlite3.connect("d:\\python-chrome-cookies")
  9.     ret_list = []
  10.     ret_dict = {}
  11.     for row in Cookice.execute("select host_key, name, path, value, encrypted_value from cookies"):
  12.         if row[0] != url:
  13.             continue
  14.         ret = win32crypt.CryptUnprotectData(row[4], None, None, None, 0)
  15.         ret_list.append((row[1], ret[1]))
  16.         ret_dict[row[1]] = ret[1].decode()
  17.     Cookice.close()
  18.     os.system('del"D:\\python-chrome-cookies"')#删掉Cookice
  19.     return ret_dict

  20. #模拟头部
  21. headers = {
  22.     'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36',
  23.     # 'accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
  24.     # 'accept-language':'zh-CN,zh;q=0.8',
  25.     # 'accept-encoding':'gzip, deflate, br',
  26.     # 'referer':''
  27.     }

  28. #打开链接
  29. x = requests.get("http://www.taobao.com", cookies = get_chrome_cookies(".taobao.com"),headers=headers)
  30. print(x.text)
  31. if "用户名" in x.text :
  32.     print("登录成功")
  33. else:
  34.     print("登录失败")
复制代码

最佳答案

查看完整内容

通过观察, Python 获取的源代码文件大小远小于真实访问源代码大小 大胆猜测登录验证与 JS 有关, 在浏览器中禁用 JS 再进行真实访问, 结果提示未登录 结论: 需要使用 JS 解释器来模拟登录 (PhantomJS)
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2016-11-22 22:41:13 | 显示全部楼层
304079992 发表于 2016-11-22 23:17
代码几乎是一样的,我没能发现有用信息

通过观察, Python 获取的源代码文件大小远小于真实访问源代码大小
大胆猜测登录验证与 JS 有关, 在浏览器中禁用 JS 再进行真实访问, 结果提示未登录
结论: 需要使用 JS 解释器来模拟登录 (PhantomJS)
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2016-11-22 22:47:57 | 显示全部楼层
输出一下 html 看看
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-11-22 22:56:55 | 显示全部楼层
hldh214 发表于 2016-11-22 22:47
输出一下 html 看看

输出的HTML代码就是网页未登录成功时的代码。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-11-22 23:03:08 | 显示全部楼层
hldh214 发表于 2016-11-22 22:47
输出一下 html 看看

输出后的HTML代码

test.rar

10.55 KB, 下载次数: 2

输出后的HTML

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2016-11-22 23:04:59 | 显示全部楼层

把这个 html 和你真实在浏览器访问的代码做对比
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-11-22 23:05:43 | 显示全部楼层
hldh214 发表于 2016-11-22 23:04
把这个 html 和你真实在浏览器访问的代码做对比

好的,我先看看
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-11-22 23:17:26 | 显示全部楼层
hldh214 发表于 2016-11-22 23:04
把这个 html 和你真实在浏览器访问的代码做对比

代码几乎是一样的,我没能发现有用信息

代码对比.rar

297.09 KB, 下载次数: 2

python读取的代码与网页源代码对比

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-11-23 00:01:20 | 显示全部楼层
hldh214 发表于 2016-11-22 23:33
通过观察, Python 获取的源代码文件大小远小于真实访问源代码大小
大胆猜测登录验证与 JS 有关, 在浏览 ...

禁用了JS果然就没发登录了,启用了JS就可以。谢谢指点了~!
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-24 01:51

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表