鱼C论坛

 找回密码
 立即注册
查看: 602|回复: 14

[已解决]Python循环

[复制链接]
发表于 2018-8-14 09:51:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
初学者,我在尝试爬虫的时候循环总是只输出第一个的内容,这是为什么?

运行结果

运行结果


部分代码如下:

部分代码

部分代码

希望可以帮忙解答,万分感谢!
最佳答案
2018-8-14 10:10:09
puzixia 发表于 2018-8-14 09:56
我这是同一页里面的内容,应该有十条不同的内容,不知道为什么输出了十条同样的结果

哦。。你这是用一条表达式连续匹配了10次同一处的内容。
解决方法:
1.用类似于re.findall的函数来解决(寻找所有的匹配的内容)
2.读一半删一半
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-8-14 09:54:25 | 显示全部楼层
页数+1了没?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-8-14 09:56:58 | 显示全部楼层

我这是同一页里面的内容,应该有十条不同的内容,不知道为什么输出了十条同样的结果
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-8-14 10:10:09 | 显示全部楼层    本楼为最佳答案   
puzixia 发表于 2018-8-14 09:56
我这是同一页里面的内容,应该有十条不同的内容,不知道为什么输出了十条同样的结果

哦。。你这是用一条表达式连续匹配了10次同一处的内容。
解决方法:
1.用类似于re.findall的函数来解决(寻找所有的匹配的内容)
2.读一半删一半
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-8-14 10:14:54 | 显示全部楼层
本帖最后由 puzixia 于 2018-8-14 10:16 编辑
无符号整形 发表于 2018-8-14 10:10
哦。。你这是用一条表达式连续匹配了10次同一处的内容。
解决方法:
1.用类似于re.findall的函数来解决 ...


哦,好的谢谢,我试试,可以再详细问一下什么您说的‘读一半删一半’是什么意思
还有就是re.findall不是一般用于循环之外吗,这个也可以用在for循环里?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-8-14 10:15:42 | 显示全部楼层
puzixia 发表于 2018-8-14 10:14
哦,好的谢谢,我试试,可以再详细问一下什么您说的‘读一半删一半’是什么意思

就是说,匹配到的字符串全部删掉。
(匹配完毕之后删掉 这样下一次匹配的时候就不会出现问题)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-8-14 10:22:41 | 显示全部楼层
puzixia 发表于 2018-8-14 10:14
哦,好的谢谢,我试试,可以再详细问一下什么您说的‘读一半删一半’是什么意思
还有就是re. ...

不是啊,先得到列表再送代。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-8-14 10:38:53 | 显示全部楼层
无符号整形 发表于 2018-8-14 10:22
不是啊,先得到列表再送代。

我现在已经得到列表了,我输出定位的那条语句是列表的形式,包括我输出content也可以获得列表形式的全部的不同内容,但当我想把他们分开的时候就这样子了。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-8-14 10:42:28 | 显示全部楼层
puzixia 发表于 2018-8-14 10:38
我现在已经得到列表了,我输出定位的那条语句是列表的形式,包括我输出content也可以获得列表形式的全部 ...

怎样子?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-8-14 10:56:00 | 显示全部楼层

contents是这个样子:
QQ图片20180814104610.png
循环里的content的输出是下面这样:
QQ图片20180814105040.png
当我把issn号后面的【0】去掉后是这样的:
QQ图片20180814105523.png
但是如果这么做我觉得循环就没有意义了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-8-14 11:05:03 | 显示全部楼层
puzixia 发表于 2018-8-14 10:56
contents是这个样子:

循环里的content的输出是下面这样:

还是有意义的……但是假如你下标访问contect就是没有循环更好啦。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-8-14 11:12:43 | 显示全部楼层
无符号整形 发表于 2018-8-14 11:05
还是有意义的……但是假如你下标访问contect就是没有循环更好啦。

是的,所以我这个问题只能换一种方式解决?还是不要循环了?主要是没明白为什么会这样子,一输出就为同样的内容了,谢谢您的帮助
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-8-14 11:44:43 | 显示全部楼层
puzixia 发表于 2018-8-14 11:12
是的,所以我这个问题只能换一种方式解决?还是不要循环了?主要是没明白为什么会这样子,一输出就为同样 ...

其实寻不循环都行。

点评

遍历得到就行,循环只是一种方式  发表于 2018-8-14 11:44
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-8-14 14:34:41 | 显示全部楼层
无符号整形 发表于 2018-8-14 11:44
其实寻不循环都行。

好谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-16 16:14

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表