鱼C论坛

 找回密码
 立即注册
查看: 738|回复: 9

[已解决]为什么没有显示 请大佬指点

[复制链接]
发表于 2018-7-25 22:33:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import requests
from bs4 import BeautifulSoup
import time

headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"}
def get_info(url):
    wb_data=requests.get(url,headers=headers)
    soup=BeautifulSoup(wb_data.text,'html.parser')#获取内容,自动转码unicode
    titles=soup.select('div.shixian_zhaobiao > dl > dt > a')
    times=soup.select('div.shixian_zhaobiao > dl > dd')
    lianjies=soup.select('div.shixian_zhaobiao > dl > dt > a')
    for title,time,lianjie in zip(titles,times,lianjies):
        data={
            'title':titles.get_text(),
            'time':times.get_text(),
            'lianjie':lianjies.get('herf')
        }
        print(data)

if __name__=='__main__':
    url='http://www.qianlima.com/zb/area_305/'
    get_info(url)
    time.sleep(2)
最佳答案
2018-7-25 23:21:01
  1. data={
  2.             'title':title.get_text(),
  3.             'time':time.get_text(),
  4.             'lianjie':lianjie.get('herf')
  5.         }
复制代码
#把s都去掉
你代码错了,应该是title、time、lianjie
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-7-25 23:21:01 | 显示全部楼层    本楼为最佳答案   
  1. data={
  2.             'title':title.get_text(),
  3.             'time':time.get_text(),
  4.             'lianjie':lianjie.get('herf')
  5.         }
复制代码
#把s都去掉
你代码错了,应该是title、time、lianjie
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-26 09:20:28 | 显示全部楼层
故梦L 发表于 2018-7-25 23:21
#把s都去掉
你代码错了,应该是title、time、lianjie

谢谢 您的回复  您试过我这个代码??
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-26 10:35:59 | 显示全部楼层
故梦L 发表于 2018-7-25 23:21
#把s都去掉
你代码错了,应该是title、time、lianjie


import requests
from bs4 import BeautifulSoup
import time

headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}

def get_info(url):
    wb_data=requests.get(url,headers=headers)
    soup=BeautifulSoup(wb_data.text,'html.parser')
    titles=soup.select('div.content_left > div.result c-container > h3.t > a')
    times=soup.select('div.content_left > div.result c-container > div.c-abstract > span. newTimeFactor_before_abs m')
    lianjies=soup.select('div.content_left > div.result c-container > div.f13 > a')
    for title,time,lianjie in zip(titles,times,lianjies):
        data={
            'title': title.get_text(),
            'time': time.get_text(),
            'lianjie': lianjie.get('href')
        }
        print(data)
if __name__=="__main__":
    url="https://www.baidu.com/s?wd=beautifulsoup%20%E5%AE%9E%E4%BE%8B&pn=0&oq=beautifulsoup%20%E5%AE%9E%E4%BE%8B&tn=baiduhome_pg&ie=utf-8&rsv_idx=2&rsv_pq=a1dba5b60000349c&rsv_t=5e62JFAdMhuxnVf%2BJemNRZjzKd3IoF30tWm3P%2BJnl4fU%2FdnbpkFNB8wdSYMdPDCp1o1V"
    get_info(url)
    time.sleep(2)

可以帮忙再看下这个为什么不能显示  代码运行正常
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-26 13:27:10 | 显示全部楼层
我点进了url,是百度的搜索页面?解析错了或是url错了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-26 19:40:34 | 显示全部楼层
故梦L 发表于 2018-7-26 13:27
我点进了url,是百度的搜索页面?解析错了或是url错了

谢谢您 我再试试。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-27 11:09:55 | 显示全部楼层
故梦L 发表于 2018-7-26 13:27
我点进了url,是百度的搜索页面?解析错了或是url错了

import requests
from bs4 import BeautifulSoup
import time
headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
def get_info(url):
    wb_data=requests.get(url,headers=headers)
    soup=BeautifulSoup(wb_data.text,"html.parser")
    authors=soup.select('div.article block untagged mb15 typs_hot > div.author clearfix > a > h2')
    full_contents=soup.select('div.article block untagged mb15 typs_hot > a.contentHerf > div.content > span')
    ages=soup.select('#content-left > div > div.author.clearfix > div.articleGender manIcon')
    smiles=soup.select('a.contentHerf > div.stats > span.stats-vote > a >i.number')

    for author,full_content,age,smile in zip(authors,full_contents,ages,smiles):
        data={
            'author':author.get_text(),
            'full_content':full_content.get_text(),
            'age':age.get_text(),
            'smile':smile.get_text(),

        }

        print(data)

if __name__=='__main__':
    urls=['https://www.qiushibaike.com/hot/page/{}/'.format(str(i)) for i in range(1,4)]
    for url in urls:
        get_info(url)
    time.sleep(2)

可以帮忙再看下 这个代码吗 还是一样的情况 都是没有显示
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-27 12:51:42 | 显示全部楼层
  1. import requests
  2. from bs4 import BeautifulSoup
  3. import time

  4. headers = {
  5.     'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}


  6. def get_info(url):

  7.     wb_data = requests.get(url, headers=headers)
  8.     soup = BeautifulSoup(wb_data.text, "html.parser")
  9.     authors = soup.select('#content-left > div > .author > a > h2')
  10.     full_contents = soup.select('#content-left > div > a.contentHerf > .content > span')
  11.     ages = soup.select('#content-left > div > .author > .articleGender')
  12.     smiles = soup.select('#content-left > div > .stats > .stats-vote > .number')

  13.     for zips in zip(authors, full_contents, ages, smiles):
  14.         data={
  15.             'author':zips[0].get_text().strip(),
  16.             'full_content':zips[1].get_text().strip(),
  17.             'age':zips[2].get_text(),
  18.             'smile':zips[3].get_text(),
  19.         }
  20.         print(data)



  21. if __name__ == '__main__':
  22.     urls = ['https://www.qiushibaike.com/hot/page/{}/'.format(str(i)) for i in range(1, 4)]
  23.     for url in urls:
  24.         get_info(url)

  25.     time.sleep(2)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-27 12:53:04 | 显示全部楼层
你解析的语法错了,你可以用xpath来解析,和css选择器差不多
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-27 13:26:30 | 显示全部楼层
故梦L 发表于 2018-7-27 12:53
你解析的语法错了,你可以用xpath来解析,和css选择器差不多

好的 谢谢您,
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-9 02:59

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表