各位论友好!我是python初学者,之前在网上看过一个用python3来爬取"心食谱"网站食谱有关参数的视频,然后自己也动手实践一下,遇到了一些难题。小弟第一次在论坛上发帖,格式不规范、问题描述不[/code]清楚请多多指点!
首先这是”心食谱“的某食谱栏目一个网址: http://www.xinshipu.com/zuofa/598775。(我不是来打广告的!!!!)
我的目的是抓取图中信息:【干锅千叶豆腐】超级下饭越吃越过瘾,0.0分 0位评价,食谱号 598775 阅读 7,764次 收藏 68次,乐悠厨房。
首先我打开谷歌浏览器的开发者工具,点击network,清空当前页面,
之后又重新刷新了一下网页,于是有了以下图片:
然后选择在开发者工具栏目上点击了“598755”.点击进去后,找到到了url=http://www.xinshipu.com/zuofa/598775
点击复制该链接,直接粘贴在谷歌浏览器的插件工具postman的url栏目上,看看能不能有对应的html代码。
于是我找到了有关我要抓取信息的html标签,所以我就觉得,该url可以产生包含我想要抓取的信息的html标签
于是我开始用编写python代码,用了BeautifulSoup和requests模块。代码如下:
然而结果,输出来的html代码并不含有关抓取的信息的便签,同时不输出含有食谱号,收藏次数的html代码。
这是为什么呢?为什么之前postman检测该url时都含有下图被选中的html代码,而用beautifulsoup解析后却没有了?
请各位论友指点指点!!多谢!!!
|