鱼C论坛

 找回密码
 立即注册
12
返回列表 发新帖
楼主: 哈岁NB

[已解决]爬虫

[复制链接]
 楼主| 发表于 2023-3-5 15:38:32 | 显示全部楼层
isdkz 发表于 2023-3-5 14:51
因为你当前工作目录中没有 data 这个文件夹,

sharehold_records_df.to_excel("./data/sharehold_reco ...

这行代码就是添加的这个吗?为什么要len(record) == 7呢
)(}I3IR%X~08MAK9C~3ZI5A.png
~%3KX55)CWW@`23GK}I7@IA.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-3-5 15:45:15 | 显示全部楼层
哈岁NB 发表于 2023-3-5 15:33
这个不是把标签所有的内容输出了吗,如果单独想要这个标签的文本呢

css选择器只能选择到特定的元素,

如果你想要获取标签的文本就遍历每一个元素,使用 .string
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-5 15:46:59 | 显示全部楼层
isdkz 发表于 2023-3-5 15:45
css选择器只能选择到特定的元素,

如果你想要获取标签的文本就遍历每一个元素,使用 .string

好的,感谢感谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-3-5 15:48:28 | 显示全部楼层
哈岁NB 发表于 2023-3-5 15:38
这行代码就是添加的这个吗?为什么要len(record) == 7呢

这行代码是将每一行的内容添加进去,这个表格一共有6列,再加上 自己加的那一列 stock 一共7列

当有7列的时候才将它加进结果中
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-5 15:49:28 | 显示全部楼层
isdkz 发表于 2023-3-5 15:48
这行代码是将每一行的内容添加进去,这个表格一共有6列,再加上 自己加的那一列 stock 一共7列

当有7 ...

明白了,感谢感谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-5 22:24:08 | 显示全部楼层
这种和那种动态数据返回一串json字符串有什么区别呀
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 11:52:16 | 显示全部楼层
isdkz 发表于 2023-3-5 14:05
那个是 js 动态渲染出来的,因为 requests 不会帮你自动获取静态资源(js、css)来渲染,

他只会帮你请 ...


这种和那种动态数据返回一串json字符串有什么区别呀
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-3-6 12:02:17 | 显示全部楼层
哈岁NB 发表于 2023-3-6 11:52
这种和那种动态数据返回一串json字符串有什么区别呀

返回一串字符串的只是获取数据源而已,而动态渲染是根据数据源来去修改文档对象模型(dom)

将数据展示到页面上来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:16:39 | 显示全部楼层
isdkz 发表于 2023-3-6 12:02
返回一串字符串的只是获取数据源而已,而动态渲染是根据数据源来去修改文档对象模型(dom)

将数据展 ...

那动态渲染是根据数据源去修改,那我不是可以直接定位到这个数据源直接获取数据吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-3-6 12:24:10 | 显示全部楼层
哈岁NB 发表于 2023-3-6 12:16
那动态渲染是根据数据源去修改,那我不是可以直接定位到这个数据源直接获取数据吗


确实是,它要渲染页面肯定要去数据源那里获取数据的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:33:16 | 显示全部楼层
isdkz 发表于 2023-3-6 12:24
确实是,它要渲染页面肯定要去数据源那里获取数据的

那这个数据源为什么一定位就还是首页呢,然后也获取不到,而不是像有的页面动态数据一定位就是JSON字符串呢
屏幕截图(40).png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-3-6 12:39:14 | 显示全部楼层
哈岁NB 发表于 2023-3-6 12:33
那这个数据源为什么一定位就还是首页呢,然后也获取不到,而不是像有的页面动态数据一定位就是JSON字符串 ...

不是所有的数据返回的都是 json 的,返回 json 的一般都是有结构、有规律的数据

你要找出它渲染上去的那个是通过哪个请求获取到的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:43:55 | 显示全部楼层
isdkz 发表于 2023-3-6 12:39
不是所有的数据返回的都是 json 的,返回 json 的一般都是有结构、有规律的数据

你要找出它渲染上去的 ...

那全局搜索不是就能搜索到这个请求吗,那这个为什么一搜索除了首页那个请求就没其他请求了呢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-3-6 12:50:07 | 显示全部楼层
哈岁NB 发表于 2023-3-6 12:43
那全局搜索不是就能搜索到这个请求吗,那这个为什么一搜索除了首页那个请求就没其他请求了呢

确实可以搜到,我之前有一点没有考虑到,数据源不一定是后面通过 js 发起请求的,

也有可能它跟主页面一起返回,只不过在 js 脚本那里,后面才通过 js 脚本渲染上去

截图20230306124827.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-3-6 12:56:31 | 显示全部楼层
isdkz 发表于 2023-3-6 12:50
确实可以搜到,我之前有一点没有考虑到,数据源不一定是后面通过 js 发起请求的,

也有可能它跟主页面 ...

明白了,感谢感谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-24 09:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表