鱼C论坛

 找回密码
 立即注册
楼主: wrpython

[已解决]字典嵌套列表,列表元素为字典,添加列表元素后报错

[复制链接]
 楼主| 发表于 2024-1-11 17:31:56 | 显示全部楼层
<a href="/Archives/edgar/data/1144215/0001965353-24-000012-index.html">144</a> 如何提取这个标签中的href链接?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-11 17:32:08 | 显示全部楼层
wrpython 发表于 2024-01-11 17:31
144 如何提取这个标签中的href链接?


要提取包含 `<a>` 标签的 `href` 属性的链接,可以使用 BeautifulSoup 库来解析 HTML 文档,并使用 `.get()` 方法来获取属性值。以下是一个简单的示例代码:from bs4 import BeautifulSouphtml = '''<a href="http://www.example.com">Example Link</a>'''soup = BeautifulSoup(html, 'html.parser')# 提取 href 属性的链

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-11 22:18:05 | 显示全部楼层
你给的代码不正确,重新用python提取<a >Example Link</a>中的http://www.example.com
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-11 22:18:14 | 显示全部楼层
wrpython 发表于 2024-01-11 22:18
你给的代码不正确,重新用python提取Example Link中的 ...


非常抱歉,之前的回答有误。要提取 `<a>` 标签中的 `href` 链接,可以使用正则表达式或 BeautifulSoup 库来解析 HTML 文档。以下是使用 BeautifulSoup 的示例代码:from bs4 import BeautifulSouphtml = ''''''soup = BeautifulSoup(html, 'html.parser')link = soup.

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-11 22:20:18 | 显示全部楼层
再整理一下代码格式
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-11 22:20:34 | 显示全部楼层
wrpython 发表于 2024-01-11 22:20
再整理一下代码格式


当提取 `<a>` 标签中的 `href` 链接时,你可以使用 BeautifulSoup 库来解析 HTML 文档。以下是一个整理过的示例代码:
from bs4 import BeautifulSoup

html = '''
<html>
<body>
<a href="http://www.example.com">Example Link</a>
</body>
</html>
'''

soup = BeautifulSoup(html, 'html.parser')
link = soup.a['href']
print(link)

这段代码将会输出:`http://www.example.com`,即成功提取了 `<a>` 标签中的 `href` 链接。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-11 22:23:41 | 显示全部楼层
你能找出今天SEC发布的所有13G文件吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-11 22:24:00 | 显示全部楼层
wrpython 发表于 2024-01-11 22:23
你能找出今天SEC发布的所有13G文件吗?


很抱歉,我无法实时获取SEC(美国证券交易委员会)发布的文件。SEC的数据通常通过EDGAR系统进行访问和检索。你可以访问SEC的官方网站,使用EDGAR搜索工具来查找并获取最新的13G文件。EDGAR提供了一种途径以电子方式获取公开的公司报告、注册声明和其他信息。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-12 17:02:52 | 显示全部楼层
BeautifulSoup读取的字符串无法转化为整数,怎么解决?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-12 17:03:05 | 显示全部楼层
wrpython 发表于 2024-01-12 17:02
BeautifulSoup读取的字符串无法转化为整数,怎么解决 ...


如果你使用 BeautifulSoup 读取的字符串无法转化为整数,可能是因为字符串中包含了非数字字符或其他格式问题。要解决这个问题,可以尝试以下几种方法:1. 使用 `str.replace()` 方法去除非数字字符:将字符串中的非数字字符替换为空字符串,然后再尝试进行转换。例如:```num_str = "123a"cleaned_str = num_str.replac

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-12 17:10:21 | 显示全部楼层
ValueError: could not convert string to float: 'Common'
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-12 17:10:36 | 显示全部楼层
wrpython 发表于 2024-01-12 17:10
ValueError: could not convert string to float: 'Co ...


如果你尝试将字符串转换为浮点数时出现 ValueError 错误,错误信息为 "could not convert string to float",通常是因为字符串中包含无法被转换为浮点数的字符。在你的情况下,字符串中含有 "Common" 这个不可转换的字符。为了解决这个问题,你需要确保仅对可以转换为浮点数的字符串进行转换。你可以使用条件语句丢弃带有 "Common" 的字符串或者先提取其中的数字部分再进行转换。以下是示例代码:
= '23.45 Common'if 'Common' not in string:    floatValue = float(string)print(floatValue)

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-13 00:32:03 | 显示全部楼层
<tbody>
    <div></div>
    <div></div>
    <div></div>
</tbody>
html格式如上,如何用beautifulsoup找到<tbody>里面的所有div标签?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-13 00:32:12 | 显示全部楼层
wrpython 发表于 2024-01-13 00:32
html格式如上,如何用beautifulsoup找到里面的所有div ...


要使用 BeautifulSoup 找到 HTML 中的所有 `<div>` 标签,你可以使用 `.find_all()` 方法结合标签名称进行查找。以下是一个示例代码:from bs4 import BeautifulSouphtml = '''   <div class="content">       <h1>Title</h1>       <p>Paragraph 1</p>       <div class="inner-div">           <h2>Subtitl

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-13 00:33:33 | 显示全部楼层
整理一下代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-13 00:33:44 | 显示全部楼层


请使用下面整理过的代码来找到 HTML 中的所有 `div` 标签:
from bs4 import BeautifulSoup

html = '''
<html>
  <body>
    <div class="container">
      <div class="inner-div">
        <h1>Title</h1>
        <p>Paragraph 1</p>
      </div>
      <div class="inner-div">
        <h2>Subtitle</h2>
        <p>Paragraph 2</p>
      </div>
    </div>
  </body>
</html>
'''

soup = BeautifulSoup(html, 'html.parser')
div_tags = soup.find_all('div')

for div in div_tags:
    print(div)

这段代码将会输出 HTML 中的所有 `div` 标签。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-13 00:35:09 | 显示全部楼层
这段代码中,如何找到<p>Paragraph 2</p>呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-13 00:35:14 | 显示全部楼层
wrpython 发表于 2024-01-13 00:35
这段代码中,如何找到Paragraph 2呢?


要找到 HTML 中的 "Paragraph 2",你可以使用 `.find()` 方法来查找对应的标签,并根据其内容或属性进一步判断。以下是修改后的代码示例:from bs4 import BeautifulSouphtml = '''                    Title        Paragraph 1

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-1-13 00:36:20 | 显示全部楼层
整理代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-1-13 00:36:28 | 显示全部楼层


请使用下面整理过的代码来找到 HTML 中的 "Paragraph 2":from bs4 import BeautifulSouphtml = '''                    Title        Paragraph 1                    Subtitle        Paragraph 2            '''soup = BeautifulSoup(html, 'html.parser')p2 = soup.find('div', text='Paragraph 2')if p2:    print(p2.get_text())

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-23 15:05

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表