鱼C论坛

 找回密码
 立即注册
查看: 703|回复: 2

[已解决]关于python爬文字的问题

[复制链接]
发表于 2020-2-24 14:36:45 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我想爬乐乐课堂网站一些文字
Screen Shot 2020-02-24 at 14.22.04.png
红色部分是我想爬取的部分
于是就去b站看小甲鱼的爬虫教程
然后按照教程照葫芦画瓢编写了程序

Screen Shot 2020-02-24 at 14.36.11.png
  1. >>> import requests
  2. >>> import bs4
  3. >>> res = requests.get("http://www.leleketang.com/cr/stages.php?id=176330")

  4. >>> soup = bs4.BeautifulSoup(res.text, "html.parser")
  5. >>> targets = soup.find_all("div", class_="kn_o_name ellipsis")
  6. >>> for each in targets:
  7.         print(each.a.span.text)

  8.        
复制代码

但是报错了
Screen Shot 2020-02-24 at 14.27.36.png

但是这样输入就没问题
  1. >>> for each in targets:
  2.         print(each)

  3.        
  4. <div class="kn_o_name ellipsis" title="三数和平方公式">1. 三数和平方公式</div>
  5. <div class="kn_o_name ellipsis" title="立方和公式及立方差公式">2. 立方和公式及立方差公式</div>
  6. <div class="kn_o_name ellipsis" title="和与差的完全立方公式">3. 和与差的完全立方公式</div>
  7. <div class="kn_o_name ellipsis" title="整式除法">4. 整式除法</div>
  8. <div class="kn_o_name ellipsis" title="运用公式法">5. 运用公式法</div>
  9. <div class="kn_o_name ellipsis" title="换元法">6. 换元法</div>
  10. <div class="kn_o_name ellipsis" title="待定系数法">7. 待定系数法</div>
  11. <div class="kn_o_name ellipsis" title="找根法">8. 找根法</div>
  12. <div class="kn_o_name ellipsis" title="一元二次不等式">9. 一元二次不等式</div>
  13. <div class="kn_o_name ellipsis" title="简单含参一元二次不等式">10. 简单含参一元二次不等式</div>
  14. <div class="kn_o_name ellipsis" title="数轴穿根法解高次不等式">11. 数轴穿根法解高次不等式</div>
  15. <div class="kn_o_name ellipsis" title="分式不等式">12. 分式不等式</div>
  16. <div class="kn_o_name ellipsis" title="绝对值不等式">13. 绝对值不等式</div>
  17. <div class="kn_o_name ellipsis" title="韦达定理及其应用">14. 韦达定理及其应用</div>
  18. <div class="kn_o_name ellipsis" title="一元二次方程根的零分布">15. 一元二次方程根的零分布</div>
  19. <div class="kn_o_name ellipsis" title="一元二次方程根的k分布">16. 一元二次方程根的k分布</div>
  20. <div class="kn_o_name ellipsis" title="用函数图象处理二次型方程根的分布――在两边">17. 用函数图象处理二次型方程根的分布――在两边</div>
  21. <div class="kn_o_name ellipsis" title="用函数图象处理二次型方程根的分布――在中间">18. 用函数图象处理二次型方程根的分布――在中间</div>
  22. <div class="kn_o_name ellipsis" title="阶段复习">19. 阶段复习</div>
复制代码


没问题了.png

这应该说明了只是最后一行代码出现问题了

我只想爬取文字,不想爬取标签。

Screen Shot 2020-02-24 at 14.31.38.png
我想请问大佬们我的代码出了什么问题,
除了将targets所表示的字符串放入列表或其他的再加工字符串
我想直接爬取文字该怎么操作,麻烦各位老师了
最佳答案
2020-2-24 15:39:40
改为
>>> for each in targets:
        print(each.text)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-2-24 15:39:40 | 显示全部楼层    本楼为最佳答案   
改为
>>> for each in targets:
        print(each.text)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-25 14:21:42 | 显示全部楼层
冬雪雪冬 发表于 2020-2-24 15:39
改为
>>> for each in targets:
        print(each.text)

我试出来了不过还是感谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-29 03:46

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表