beautiful标签包裹着的标签中的文本怎么读出来？

用编程搞垮道盟 · 发表于 2019-8-19 19:46:30

您需要登录才可以下载或查看，没有账号？立即注册

x

像第零基础入门学习python55讲动动手1的题目：爬取百度百科用户输入的关键字并读出多义项副标题什么的
比如说我想爬这一坨里面的多义词和义项这几个字以及它们的网址，我就必须先锁定

复制代码

然后再看这里面的<a>标签，然后还要看<a>里面的href属性，这个要怎么做到呢？

<div class="polysemantList-header-title">
<b class="polysemant-list-lemma-title">猪八戒</b>是一个<a href="/item/%E7%99%BE%E5%BA%A6%E7%99%BE%E7%A7%91%EF%BC%9A%E5%A4%9A%E4%B9%89%E8%AF%8D" target="_blank">多义词</a>，请在下列<a href="/item/%E4%B9%89%E9%A1%B9" target="_blank">义项</a>上选择浏览（<a href="/item/%E7%8C%AA%E5%85%AB%E6%88%92?force=1" target="_blank">共10个义项</a>）<span class="polysemant-separator"></span>
<a class="polysemant-button polysemant-button--add J-polysemant-button--add" href="javascript:;" data-href="/createsub/%E7%8C%AA%E5%85%AB%E6%88%92">
<span class="polysemant-button__text J-polysemant-button__text">添加义项</span>
<em class="cmn-icon wiki-lemma-icons wiki-lemma-icons_add polysemant-button__icon J-polysemant-button__icon"></em>
</a>
</div>

复制代码

塔利班 · 发表于 2019-8-19 19:52:44

soup.a['href']

用编程搞垮道盟 · 发表于 2019-8-20 16:45:01

塔利班发表于 2019-8-19 19:52
soup.a['href']

但是这边首先是soup.find_all('div',class_='polysemantList-header-title')
然后得出来貌似就是一个Request对象，然后我也不可能把这里面的东西赋值给soup，所以不能用soup.a[href]吧？

wp231957 · 发表于 2019-8-20 16:52:08

放网址出来

空青 · 发表于 2019-8-20 17:17:28

你这描述不是很清楚，是要把所有的a标签提取出来么

复制代码

打印结果是所有a标签

<a href="/item/%E7%99%BE%E5%BA%A6%E7%99%BE%E7%A7%91%EF%BC%9A%E5%A4%9A%E4%B9%89%E8%AF%8D" target="_blank">多义词</a>
<a href="/item/%E4%B9%89%E9%A1%B9" target="_blank">义项</a>
<a href="/item/%E7%8C%AA%E5%85%AB%E6%88%92?force=1" target="_blank">共10个义项</a>
<a class="polysemant-button polysemant-button--add J-polysemant-button--add" data-href="/createsub/%E7%8C%AA%E5%85%AB%E6%88%92" href="javascript:;">
<span class="polysemant-button__text J-polysemant-button__text">添加义项</span>
<em class="cmn-icon wiki-lemma-icons wiki-lemma-icons_add polysemant-button__icon J-polysemant-button__icon"></em>
</a>

复制代码

塔利班 · 发表于 2019-8-20 17:48:10

拜托先看看bs4最基本用法

用编程搞垮道盟 · 发表于 2019-8-20 19:04:40

wp231957 发表于 2019-8-20 16:52
放网址出来

wp231957 · 发表于 2019-8-21 15:11:42

用编程搞垮道盟发表于 2019-8-20 19:04
https://baike.baidu.com/item/猪八戒/769?fr=aladdin

▪《西游记》中的角色
▪《乱斗西游》人物设定
▪动画电影《西游记之大圣归来》中的角色
▪《西行纪》中的人物
▪歌手张羽伟专辑
▪日本《最游记》人物
▪《夺宝幸运星》的角色
▪电视剧《魔幻手机》人物
▪手游《王者荣耀》中的英雄角色
▪张益魁创作的歌曲

是想获取这些东东吗

用编程搞垮道盟 · 发表于 2019-8-21 19:13:18

wp231957 发表于 2019-8-21 15:11
▪《西游记》中的角色
▪《乱斗西游》人物设定
▪动画电影《西游记之大圣归来》中的角 ...

emmmm我想爬这些文字对应的链接

账号		自动登录	找回密码
密码			立即注册