鱼C论坛

 找回密码
 立即注册
12
返回列表 发新帖
楼主: 15779327169

[已解决]使用python的requests库遇到url不变的网页如何爬取

[复制链接]
发表于 2024-4-28 17:15:18 | 显示全部楼层
15779327169 发表于 2024-04-28 17:15
如果a =[],如何把{1:3}和{2:13} 两个字典取出来


如果列表 `a` 是空列表 `[]`,你可以通过直接赋值的方式将字典取出来。以下是一个示例代码:

a = []
dict1 = {1: 3}
dict2 = {2: 13}

a.append(dict1)
a.append(dict2)

print(a)  # 输出:[{1: 3}, {2: 13}]


在上述代码中,我们首先定义了一个空列表 `a`。然后,通过使用 `append()` 方法,将 `{1: 3}` 和 `{2: 13}` 这两个字典分别添加到列表 `a` 中。最后,打印列表 `a` 的内容,就能得到取出的两个字典。

希望这对你有帮助!如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-4-28 17:21:20 | 显示全部楼层
FishC 发表于 2024-4-28 17:15
如果列表 `a` 是空列表 `[]`,你可以通过直接赋值的方式将字典取出来。以下是一个示例代码:

a = [] ...

我写的是如果a =[['{1:3}', '{2:13}']],
如何把a列表中的{1:3}和{2:13} 两个字典取出来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-4-28 17:21:36 | 显示全部楼层
15779327169 发表于 2024-04-28 17:21
我写的是如果a =[],
如何把a列表中的{1:3}和{2:13}  ...


如果 `a` 是一个空列表,要从列表中取出 `{1:3}` 和 `{2:13}` 两个字典,可以使用索引来实现。以下是一个示例代码:
a = []
dict1 = {1: 3}
dict2 = {2: 13}

a.append(dict1)
a.append(dict2)

dict1 = a[0]
dict2 = a[1]

print(dict1)  # 输出:{1: 3}
print(dict2)  # 输出:{2: 13}

在上述代码中,我们首先将 `{1:3}` 和 `{2:13}` 两个字典分别添加到空列表 `a` 中。然后,通过 `a[0]` 和 `a[1]` 分别取出第一个和第二个字典,并赋值给 `dict1` 和 `dict2` 变量。最后,通过打印这两个变量来验证结果。

希望这对你有帮助!如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-5-16 16:45:26 | 显示全部楼层
FishC 发表于 2024-4-28 17:21
如果 `a` 是一个空列表,要从列表中取出 `{1:3}` 和 `{2:13}` 两个字典,可以使用索引来实现。以下是一 ...

<p class>
“导演: 宫崎骏 Hayao Miyazaki&nbsp;&nbsp;&nbsp;主演: 柊瑠美 Rumi H&#238;ragi / 入野自由 Miy...”
<br>
用python中的re库,正则表达式如何匹配里面的文字
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-5-16 16:45:43 | 显示全部楼层
15779327169 发表于 2024-05-16 16:45
“导演: 宫崎骏 Hayao Miyazaki&nbsp;&nbsp;&nbsp;主 ...


使用Python的re库,可以使用正则表达式来匹配字符串中的文字。以下是一个示例代码:

import re

text = '导演: 宫崎骏 Hayao Miyazaki&nbsp;&nbsp;&nbsp;主演: 艾美 Rumi H&#238;ragi / 入野自由 Miy...'

pattern = r'[\u4e00-\u9fa5]+'  # 匹配中文字符的正则表达式

result = re.findall(pattern, text)
print(result)

在上述代码中,我们使用了正则表达式 `[\u4e00-\u9fa5]+` 来匹配中文字符。其中,`\u4e00` 和 `\u9fa5` 是Unicode编码范围,表示汉字的起始和结束位置。通过 `findall()` 方法,可以找到匹配的所有结果,并返回为一个列表。最后,打印结果。

运行这段代码会输出:['导演', '宫崎骏', '主演', '艾美', '自由']

表示成功匹配到了字符串中的中文文字。

需要注意的是,该正则表达式只能匹配简体中文字符,如果要匹配繁体中文或其他语言的字符,可能需要修改正则表达式的范围。

希望这能帮到你!如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2024-5-16 16:52:37 | 显示全部楼层
FishC 发表于 2024-5-16 16:45
使用Python的re库,可以使用正则表达式来匹配字符串中的文字。以下是一个示例代码:

import re

你理解错了,是如何在
<p class>
“导演: 宫崎骏 Hayao Miyazaki&nbsp;&nbsp;&nbsp;主演: 柊瑠美 Rumi H&#238;ragi / 入野自由 Miy...”
<br>
这段文章中,取出“导演: 宫崎骏 Hayao Miyazaki&nbsp;&nbsp;&nbsp;主演: 柊瑠美 Rumi H&#238;ragi / 入野自由 Miy...”
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-5-16 16:52:48 | 显示全部楼层
15779327169 发表于 2024-05-16 16:52
你理解错了,是如何在

“导演: 宫崎骏 Hayao Miyaz ...


非常抱歉我之前的回答理解错误。要在给定的文章中取出指定的文本“导演: 宫崎骏 Hayao Miyazaki&nbsp;&nbsp;&nbsp;主演: 艾美 Rumi H&#238;ragi / 入野自由 Miy...”,不需要正则表达式。可以使用字符串的切片操作来提取指定部分。以下是一个示例代码:

text = '导演: 宫崎骏 Hayao Miyazaki&nbsp;&nbsp;&nbsp;主演: 艾美 Rumi H&#238;ragi / 入野自由 Miy...'
result = text[4:]  # 从索引位置4开始截取到字符串末尾
print(result)

运行这段代码会输出:
“宫崎骏 Hayao Miyazaki&nbsp;&nbsp;&nbsp;主演: 艾美 Rumi H&#238;ragi / 入野自由 Miy...”

在上述代码中,通过使用切片操作 `text[4:]`,我们从索引位置4开始提取剩余的文本,然后将结果赋值给 `result` 变量。最后,打印结果。

希望这次能满足您的需求!如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-22 18:25

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表