xmxjf 发表于 2019-7-12 20:19:21

抓取豆瓣top250里视频里未说明的问题

import requests
import bs4
res =requests.get("https://movie.douban.com/top250")
soup=bs4.BeautifulSoup(res.text,"html.parser")
targets=soup.find_all("div",class_="hd")
for each in targets:
    print(each.a.span.text)
视频里这段代码质可以提取出第一行的span>>>电影的名字.

但是第二行和第三行的span的信息确提取不出来,请问怎么才能提取出来。
<span class="title">&nbsp;/nbsp;The Shawshank Redemption</span>
<span class="other">&nbsp;/nbsp;月黑高飞(港)/刺激1995(台)</span>
这两行的信息怎么提取出来呢?

chxchxkkk 发表于 2019-7-13 18:48:47

import requests
import bs4
res =requests.get("https://movie.douban.com/top250")
soup=bs4.BeautifulSoup(res.text,"html.parser")
targets=soup.find_all("div",class_="hd")

for each in targets:
    b = each.a
    span_text = b.find_all('span')
    for s in span_text:
      print(s.text)

代码虽然写的乱了些,这样应该能实现你的想法

社会主义大镰刀 发表于 2019-11-23 16:54:51

那么为什么我无论用小甲鱼一开始的代码还是你的代码虽然没有报错,但是什么都没有输出呢

一页温差 发表于 2019-12-15 20:43:44

社会主义大镰刀 发表于 2019-11-23 16:54
那么为什么我无论用小甲鱼一开始的代码还是你的代码虽然没有报错,但是什么都没有输出呢

+1

甲鱼飞鱼 发表于 2021-4-1 22:02:28

那么为什么我无论用小甲鱼一开始的代码还是你的代码虽然没有报错,但是什么都没有输出呢

页: [1]
查看完整版本: 抓取豆瓣top250里视频里未说明的问题