[已解决]为什么没有显示请大佬指点

slhlde · 发表于 2018-7-25 22:33:01

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import requests
from bs4 import BeautifulSoup
import time

headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"}
def get_info(url):
wb_data=requests.get(url,headers=headers)
soup=BeautifulSoup(wb_data.text,'html.parser')#获取内容，自动转码unicode
titles=soup.select('div.shixian_zhaobiao > dl > dt > a')
times=soup.select('div.shixian_zhaobiao > dl > dd')
lianjies=soup.select('div.shixian_zhaobiao > dl > dt > a')
for title,time,lianjie in zip(titles,times,lianjies):
      data={
         'title':titles.get_text(),
         'time':times.get_text(),
         'lianjie':lianjies.get('herf')
      }
      print(data)

if __name__=='__main__':
url='http://www.qianlima.com/zb/area_305/'
get_info(url)
time.sleep(2)

最佳答案

月排行榜 / 总排行榜

故梦L

2018-7-25 23:21:01

data={
'title':title.get_text(),
'time':time.get_text(),
'lianjie':lianjie.get('herf')
}

复制代码

#把s都去掉
你代码错了，应该是title、time、lianjie

跳转到最佳答案楼层

故梦L · 发表于 2018-7-25 23:21:01

data={
'title':title.get_text(),
'time':time.get_text(),
'lianjie':lianjie.get('herf')
}

复制代码

#把s都去掉
你代码错了，应该是title、time、lianjie

slhlde · 发表于 2018-7-26 09:20:28

故梦L 发表于 2018-7-25 23:21
#把s都去掉
你代码错了，应该是title、time、lianjie

谢谢您的回复您试过我这个代码？？

slhlde · 发表于 2018-7-26 10:35:59

故梦L 发表于 2018-7-25 23:21
#把s都去掉
你代码错了，应该是title、time、lianjie

import requests
from bs4 import BeautifulSoup
import time

headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}

def get_info(url):
wb_data=requests.get(url,headers=headers)
soup=BeautifulSoup(wb_data.text,'html.parser')
titles=soup.select('div.content_left > div.result c-container > h3.t > a')
times=soup.select('div.content_left > div.result c-container > div.c-abstract > span. newTimeFactor_before_abs m')
lianjies=soup.select('div.content_left > div.result c-container > div.f13 > a')
for title,time,lianjie in zip(titles,times,lianjies):
      data={
         'title': title.get_text(),
         'time': time.get_text(),
         'lianjie': lianjie.get('href')
      }
      print(data)
if __name__=="__main__":
url="https://www.baidu.com/s?wd=beautifulsoup%20%E5%AE%9E%E4%BE%8B&pn=0&oq=beautifulsoup%20%E5%AE%9E%E4%BE%8B&tn=baiduhome_pg&ie=utf-8&rsv_idx=2&rsv_pq=a1dba5b60000349c&rsv_t=5e62JFAdMhuxnVf%2BJemNRZjzKd3IoF30tWm3P%2BJnl4fU%2FdnbpkFNB8wdSYMdPDCp1o1V"
get_info(url)
time.sleep(2)

可以帮忙再看下这个为什么不能显示  代码运行正常

故梦L · 发表于 2018-7-26 13:27:10

我点进了url，是百度的搜索页面？解析错了或是url错了

slhlde · 发表于 2018-7-26 19:40:34

故梦L 发表于 2018-7-26 13:27
我点进了url，是百度的搜索页面？解析错了或是url错了

谢谢您我再试试。

slhlde · 发表于 2018-7-27 11:09:55

故梦L 发表于 2018-7-26 13:27
我点进了url，是百度的搜索页面？解析错了或是url错了

import requests
from bs4 import BeautifulSoup
import time
headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
def get_info(url):
wb_data=requests.get(url,headers=headers)
soup=BeautifulSoup(wb_data.text,"html.parser")
authors=soup.select('div.article block untagged mb15 typs_hot > div.author clearfix > a > h2')
full_contents=soup.select('div.article block untagged mb15 typs_hot > a.contentHerf > div.content > span')
ages=soup.select('#content-left > div > div.author.clearfix > div.articleGender manIcon')
smiles=soup.select('a.contentHerf > div.stats > span.stats-vote > a >i.number')

for author,full_content,age,smile in zip(authors,full_contents,ages,smiles):
      data={
         'author':author.get_text(),
         'full_content':full_content.get_text(),
         'age':age.get_text(),
         'smile':smile.get_text(),

      }

      print(data)

if __name__=='__main__':
urls=['https://www.qiushibaike.com/hot/page/{}/'.format(str(i)) for i in range(1,4)]
for url in urls:
      get_info(url)
time.sleep(2)

可以帮忙再看下这个代码吗还是一样的情况都是没有显示

故梦L · 发表于 2018-7-27 12:51:42

import requests
from bs4 import BeautifulSoup
import time
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
def get_info(url):
wb_data = requests.get(url, headers=headers)
soup = BeautifulSoup(wb_data.text, "html.parser")
authors = soup.select('#content-left > div > .author > a > h2')
full_contents = soup.select('#content-left > div > a.contentHerf > .content > span')
ages = soup.select('#content-left > div > .author > .articleGender')
smiles = soup.select('#content-left > div > .stats > .stats-vote > .number')
for zips in zip(authors, full_contents, ages, smiles):
data={
'author':zips[0].get_text().strip(),
'full_content':zips[1].get_text().strip(),
'age':zips[2].get_text(),
'smile':zips[3].get_text(),
}
print(data)
if __name__ == '__main__':
urls = ['https://www.qiushibaike.com/hot/page/{}/'.format(str(i)) for i in range(1, 4)]
for url in urls:
get_info(url)
time.sleep(2)

复制代码

故梦L · 发表于 2018-7-27 12:53:04

你解析的语法错了，你可以用xpath来解析，和css选择器差不多

slhlde · 发表于 2018-7-27 13:26:30

故梦L 发表于 2018-7-27 12:53
你解析的语法错了，你可以用xpath来解析，和css选择器差不多

好的谢谢您，

账号		自动登录	找回密码
密码			立即注册

[已解决]为什么没有显示 请大佬指点

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块

[已解决]为什么没有显示请大佬指点