鱼C论坛

 找回密码
 立即注册
查看: 1113|回复: 4

[已解决]爬虫问题显示语法错误,求解答一下

[复制链接]
发表于 2019-10-17 19:00:11 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import re

browser = webdriver.Chrome()
wait = WebDriverWait(browser,10)

def search():
    try:
        browser.get('https://www.tmall.com')
        input = wait.until(
            EC.presence_of_element_located((By.CSS_SELECTOR, "#mq"))
        )
        submit = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,'#mallSearch > form > fieldset       > div > button')))
        input.send_keys('美食')
        submit.click()
        total = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,'#content > div > div.ui-page > div > b.ui-page-skip > form ')))
        return total.text
    except TimeoutException:   
        return search()

def next_page(page_number):
    try:
        input = wait.until(
            EC.presence_of_element_located((By.CSS_SELECTOR, "#content > div > div.ui-page > div > b.ui-page-skip > form > input.ui-page-skipTo"))
        )
        submit = wait.until(
            EC.element_to_be_clickable((By.CSS_SELECTOR, '#content > div > div.ui-page > div > b.ui-page-skip > form > button')))
        input.clear()
        input.send_keys('page_number')
        submit.click()
        wait.until(EC.text_to_be_present_in_element((By.CSS_SELECTOR,'#content > div > div.ui-page > div > b.ui-page-num > b.ui-page-cur',str(page_number)))
    except TimeoutException:
        next_page(page_number)

def main():
    total = search()
    total = int(re.compile('(\d+)').search(total).group(1))
    for i in range(2,total + 1):
        next_page(i)

if __name__ == '__main__':
    main()


报错信息
   except TimeoutException:
         ^
SyntaxError: invalid syntax


最佳答案
2019-10-17 19:51:14
这一句:

  1. total = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,'#content > div > div.ui-page > div > b.ui-page-skip > form ')))
复制代码


末尾少了个右括号,补上就 OK。

  1. from selenium import webdriver
  2. from selenium.webdriver.common.by import By
  3. from selenium.webdriver.support.ui import WebDriverWait
  4. from selenium.webdriver.support import expected_conditions as EC
  5. import re

  6. browser = webdriver.Chrome()
  7. wait = WebDriverWait(browser,10)

  8. def search():
  9.     try:
  10.         browser.get('https://www.tmall.com')
  11.         input = wait.until(
  12.             EC.presence_of_element_located((By.CSS_SELECTOR, "#mq"))
  13.         )
  14.         submit = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,'#mallSearch > form > fieldset       > div > button')))
  15.         input.send_keys('美食')
  16.         submit.click()
  17.         total = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,'#content > div > div.ui-page > div > b.ui-page-skip > form ')))
  18.         return total.text
  19.     except TimeoutException:   
  20.         return search()

  21. def next_page(page_number):
  22.     try:
  23.         input = wait.until(
  24.             EC.presence_of_element_located((By.CSS_SELECTOR, "#content > div > div.ui-page > div > b.ui-page-skip > form > input.ui-page-skipTo"))
  25.         )
  26.         submit = wait.until(
  27.             EC.element_to_be_clickable((By.CSS_SELECTOR, '#content > div > div.ui-page > div > b.ui-page-skip > form > button')))
  28.         input.clear()
  29.         input.send_keys('page_number')
  30.         submit.click()
  31.         wait.until(EC.text_to_be_present_in_element((By.CSS_SELECTOR,'#content > div > div.ui-page > div > b.ui-page-num > b.ui-page-cur',str(page_number))))
  32.     except TimeoutException:
  33.         next_page(page_number)

  34. def main():
  35.     total = search()
  36.     total = int(re.compile('(\d+)').search(total).group(1))
  37.     for i in range(2,total + 1):
  38.         next_page(i)

  39. if __name__ == '__main__':
  40.     main()
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-10-17 19:51:14 | 显示全部楼层    本楼为最佳答案   
这一句:

  1. total = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,'#content > div > div.ui-page > div > b.ui-page-skip > form ')))
复制代码


末尾少了个右括号,补上就 OK。

  1. from selenium import webdriver
  2. from selenium.webdriver.common.by import By
  3. from selenium.webdriver.support.ui import WebDriverWait
  4. from selenium.webdriver.support import expected_conditions as EC
  5. import re

  6. browser = webdriver.Chrome()
  7. wait = WebDriverWait(browser,10)

  8. def search():
  9.     try:
  10.         browser.get('https://www.tmall.com')
  11.         input = wait.until(
  12.             EC.presence_of_element_located((By.CSS_SELECTOR, "#mq"))
  13.         )
  14.         submit = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,'#mallSearch > form > fieldset       > div > button')))
  15.         input.send_keys('美食')
  16.         submit.click()
  17.         total = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR,'#content > div > div.ui-page > div > b.ui-page-skip > form ')))
  18.         return total.text
  19.     except TimeoutException:   
  20.         return search()

  21. def next_page(page_number):
  22.     try:
  23.         input = wait.until(
  24.             EC.presence_of_element_located((By.CSS_SELECTOR, "#content > div > div.ui-page > div > b.ui-page-skip > form > input.ui-page-skipTo"))
  25.         )
  26.         submit = wait.until(
  27.             EC.element_to_be_clickable((By.CSS_SELECTOR, '#content > div > div.ui-page > div > b.ui-page-skip > form > button')))
  28.         input.clear()
  29.         input.send_keys('page_number')
  30.         submit.click()
  31.         wait.until(EC.text_to_be_present_in_element((By.CSS_SELECTOR,'#content > div > div.ui-page > div > b.ui-page-num > b.ui-page-cur',str(page_number))))
  32.     except TimeoutException:
  33.         next_page(page_number)

  34. def main():
  35.     total = search()
  36.     total = int(re.compile('(\d+)').search(total).group(1))
  37.     for i in range(2,total + 1):
  38.         next_page(i)

  39. if __name__ == '__main__':
  40.     main()
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-10-17 20:36:03 | 显示全部楼层

谢谢大佬,那为什么报错信息显示标红那一行语法错误呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-10-17 20:36:50 | 显示全部楼层
朝歌夜弦 发表于 2019-10-17 20:36
谢谢大佬,那为什么报错信息显示标红那一行语法错误呢?

城门失火,殃及池鱼
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2019-10-18 18:14:11 | 显示全部楼层
zltzlt 发表于 2019-10-17 20:36
城门失火,殃及池鱼

O(∩_∩)O
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-27 09:13

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表