爬虫问题求帮助

海风zZ · 发表于 2018-12-21 14:00:01

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

今天安好selenuim之后，用selenuim模拟登陆qq邮箱代码如下

import time
from selenium import webdriver
from lxml import etree
driver = webdriver.Chrome()
driver.get('https://mail.qq.com/cgi-bin/loginpage')
time.sleep(3)
driver.switch_to.frame("login_frame")
driver.find_element_by_css_selector("#u").clear()
driver.find_element_by_css_selector("#u").send_keys('1910151771')
driver.find_element_by_xpath('//*[@id="p"]').clear()
driver.find_element_by_xpath('//*[@id="p"]').send_keys('**********')
driver.find_element_by_xpath('//*[@id="login_button"]').click()
# driver.find_element_by_xpath('//*[@id="login_button"]').submit()
##获取登陆页面的title判断是否登陆成功
title = driver.title
print(title)
if title == '登录QQ邮箱':
print('登陆成功')
else:
print('登录失败')
##获取当前的url与预期的url做对比
now_url = driver.current_url
print(now_url)
data =driver.page_source
html = etree.HTML(data)
now_user = driver.find_element_by_xpath('//div[@class="lgoo"]/a/div/div/b').text
# now_user = html.xpath('//div[@class="lgoo"]/a/div/div/b/@id')
print(now_user)

复制代码

问题：
1、登陆之后想爬取qq邮箱的昵称，如图2所示的红色箭头处但是运行之后报错匹配不到对应的文本，开始感觉是xpath写错了，
   然后用requests和xpath爬取了一下如图四，结果还是匹配不到，后来发现我用requests爬取下来page（见图4）和网页源代码中
   的内容不一样，如图3中划红线的部分好像page中都没有，不知道是怎么回事？求大佬指点

2、如图一所示红色箭头部分的那一行代码是什么作用，之前一直登陆不了，加了之后就可以了，

i need you  help  dalao

吐槽一下，这个贴我都发过一次了，但是就是显示我的帖子不见了，找不到，我也不知道是咋回事？

海风zZ · 发表于 2018-12-21 14:16:33

自己顶一下

账号		自动登录	找回密码
密码			立即注册

爬虫问题求帮助

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块