|

楼主 |
发表于 2018-12-16 20:50:48
|
显示全部楼层
63
scrapy框架
这节课有点难啊,有点听不懂,之后去b站找了另外一个视频去学习
https://www.bilibili.com/video/av30614389?from=search&seid=17130136822101231553
对于这个视频,scrapy的内容还没有学习,只是完善了之前学的下载图片的内容
之前下载图片最大的问题就是找不到图片链接正确的位置,现在找到了方法
1.首先ctrl+u,该快捷键打开网页的源代码(也就是网页的所有内容)
2.然后通过ctrl+f,搜索jpg关键词,找到我们需要的图片网页
3.观察该网页是不是属于标签的,要是标签方便的话,就用xpath搜索标签(简单)
4.要是属于一大堆的文本的,就用正则表达式进行搜索
xpath例子
今天做的电影名字和贴吧搜图
正则表达式的例子
网页
https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%C2%B7%B7%C9&fr=ala&ala=1&alatpl=adress&pos=0&hs=2&xthttps=111111
网页源代码
view-source:https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%C2%B7%B7%C9&fr=ala&ala=1&alatpl=adress&pos=0&hs=2&xthttps=111111
|
|