鱼C论坛

 找回密码
 立即注册
查看: 400|回复: 11

如何利用python模拟百度搜索

[复制链接]
最佳答案
0 
发表于 2020-6-22 11:53:10 | 显示全部楼层 |阅读模式
5鱼币

求助!!!!!有没有大佬会用python模拟百度搜索并将搜索到的东西罗列出来!!!!!

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
0 
发表于 2020-6-22 12:57:48 | 显示全部楼层
目前我还不知道
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
37 
发表于 2020-6-22 15:27:31 | 显示全部楼层
https://www.baidu.com/s?wd=你要搜索的字符串

应该是这样?
不太清楚哈,可以试下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
19 
发表于 2020-6-22 17:01:29 | 显示全部楼层
第三方库bs4,requests模块,应该就能干掉吧。。
现在没空,找时间我试试看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
19 
发表于 2020-6-22 17:33:45 | 显示全部楼层
这个内容指的是仅百度页面的预览信息吗....
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
0 
 楼主| 发表于 2020-6-23 05:32:36 | 显示全部楼层
青出于蓝 发表于 2020-6-22 17:33
这个内容指的是仅百度页面的预览信息吗....

就是像百度一样可以搜索,然后把搜索到的东西罗列出来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
324 
发表于 2020-6-23 08:07:33 | 显示全部楼层
小海灵 发表于 2020-6-23 05:32
就是像百度一样可以搜索,然后把搜索到的东西罗列出来

不能,死心吧。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
0 
 楼主| 发表于 2020-6-23 08:26:56 | 显示全部楼层

嘶~,不是吧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
75 
发表于 2020-6-23 08:55:32 | 显示全部楼层
  1. import requests
  2. from lxml import etree

  3. base_url = 'https://www.baidu.com/s?wd='
  4. wd = input('请输入关键词:')
  5. url = base_url + wd
  6. headers = {'user-agent': 'firefox',
  7.            'Host': 'www.baidu.com',
  8.            'cookie': 'BAIDUID=9433BAAB28C64EFB23C04609E2EDE26B'
  9.            }
  10. r = requests.get(url, headers=headers)
  11. html = etree.HTML(r.text)
  12. result = html.xpath('//div[contains(@class, "result")]/h3/a/@href')
  13. print(result)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
0 
发表于 2020-6-23 11:24:58 | 显示全部楼层
罗列到哪里呀 毫无疑问 肯定是能的  你可以试试 selenium
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
4 
发表于 2020-6-24 23:50:23 | 显示全部楼层
shan656 发表于 2020-6-23 11:24
罗列到哪里呀 毫无疑问 肯定是能的  你可以试试 selenium

用select模拟操作应该是可以的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
最佳答案
1 
发表于 2 小时前 | 显示全部楼层
你的意思是想要编写一个搜索引擎?
那需要大量的爬虫,海量的数据库以及艰深的排序算法
不管是人力、物力还是财力都不是一个人能干的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

小甲鱼强烈推荐上一条 /1 下一条

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1

GMT+8, 2020-7-9 17:47

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表