|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
- url = 'qiushibaike(dot)coOOOO5m/pic/page/[color=Red]%d[/color]/?s=5184961'
- for pageNum in range(1,3):
- #对应页码的url
- new_url = format(url%pageNum)
复制代码
上面的几行代码是某爬虫视频的教程。(因为发的代码如果包含外链,很容易被审核,挂起来,所以我把下面代码中的URL 地址改掉。“…/pic”前面是糗图百科的网址。)
这几行代码,是视频老师在讲解如何爬取糗图百科的分页。
他把/pic/page/2/?s=5184961 中的2 (代表当前的网页的第2页),改为 %d 做为一个变量, 这样的话用format 就可以用for 来循环所有的糗图页码。
1、我在B站看了format的一些用法,好象替换要用{}, 为什么上面的代码不需要用{}呢?
2、我可不可以这样写:
pic/page/%{}/?s=5184961'
……
new_url = format(pageNum)
3、怎么搜索视频中老师使用这个format的用法的知识点?我在B站看了40分钟左右的视频,那些UP主也没有提到这个用法。应该搜什么关键字?
PS--小白如果表达词不达意,请耐心指教。我在哪个地方具体说得不清楚,我可以重新表达清楚一点。
第一个问题:
- url = 'qiushibaike(dot)coOOOO5m/pic/page/[color=Red]%d[/color]/?s=5184961'
- for pageNum in range(1,3):
- #对应页码的url
- new_url = format(url%pageNum)
复制代码
这是老版本python2.6之前的格式化方法,参见 - https://www.cnblogs.com/fat39/p/7159881.html#tag1
复制代码
Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。
第二个问题: 不可以这样写,正确写法如下
- url = 'qiushibaike(dot)coOOOO5m/pic/page/{0}/?s=5184961'
- for pageNum in range(1,3):
- #对应页码的url
- new_url = url.format(pageNum)
复制代码
第三个问题,资料参见 - https://www.runoob.com/python/att-string-format.html
复制代码
|
|