鱼C论坛

 找回密码
 立即注册
查看: 1545|回复: 6

[已解决]爬虫入门问题

[复制链接]
发表于 2018-5-4 11:37:48 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
想写个成语查询的小程序,通过对某个网站比如 http://m.t086.com/chengyu 的抓取来实现
感觉应该很简单,但是不知道从何入手,想请教一下
最佳答案
2018-5-4 15:56:54
jfmlj 发表于 2018-5-4 15:30
我也知道简单,但是简单的我也不知道从哪里下手啊,下图片什么的模仿别人的也能写,但是这种涉及到post g ...
  1. import requests

  2. def get_html(text):
  3.   url = 'http://m.t086.com/index.php'
  4.   params = {
  5.     'c':'chengyu',
  6.     'm':'chaxun',
  7.     'q':text
  8.   }
  9.   html = requests.get(url,params=params).text
  10.   print(html)

  11.   
  12. get_html('闻鸡起舞')
复制代码


就这么简单,请求之后,如果有结果,结果就在网页中,根据你要提取的东西选择提取方式,那是后续要做的事情了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-5-4 12:45:48 | 显示全部楼层
看小甲鱼老师的教程,仿造着写
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-5-4 13:23:51 | 显示全部楼层
这个网站的爬虫很简单,但是建议你换一个比较正规的网站,这个网站太垃圾了,就是个广告网站
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-5-4 15:30:01 | 显示全部楼层
gopythoner 发表于 2018-5-4 13:23
这个网站的爬虫很简单,但是建议你换一个比较正规的网站,这个网站太垃圾了,就是个广告网站

我也知道简单,但是简单的我也不知道从哪里下手啊,下图片什么的模仿别人的也能写,但是这种涉及到post get的就不会了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-5-4 15:56:54 | 显示全部楼层    本楼为最佳答案   
jfmlj 发表于 2018-5-4 15:30
我也知道简单,但是简单的我也不知道从哪里下手啊,下图片什么的模仿别人的也能写,但是这种涉及到post g ...
  1. import requests

  2. def get_html(text):
  3.   url = 'http://m.t086.com/index.php'
  4.   params = {
  5.     'c':'chengyu',
  6.     'm':'chaxun',
  7.     'q':text
  8.   }
  9.   html = requests.get(url,params=params).text
  10.   print(html)

  11.   
  12. get_html('闻鸡起舞')
复制代码


就这么简单,请求之后,如果有结果,结果就在网页中,根据你要提取的东西选择提取方式,那是后续要做的事情了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-5-4 16:30:54 | 显示全部楼层
gopythoner 发表于 2018-5-4 15:56
就这么简单,请求之后,如果有结果,结果就在网页中,根据你要提取的东西选择提取方式,那是后续要做 ...

params = {
    'c':'chengyu',
    'm':'chaxun',
    'q':text
  }

这一块是根据审查元素页面的哪个部分写的,有点不理解,可以截个图吗?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-5-4 16:46:49 | 显示全部楼层

                               
登录/注册后可看大图

其实这个请求只需要看HTML中的form标签就行了,我说了这个网页做的很简单,看表单就知道请求和提交的是什么
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-22 03:32

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表