鱼C论坛

 找回密码
 立即注册
查看: 2684|回复: 12

[已解决]如何自动实现1000个型号的比价结果(悬赏)

[复制链接]
发表于 2016-12-20 23:08:45 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 棋行天下黄 于 2016-12-21 21:39 编辑

如何自动实现1000个型号的比价结果,原来上班一两个月搞一次和京东,苏宁网上比价,每次上千个型号,害我每次加班到凌晨2-3点,现在突然每周都要比价,跪求大神将比价结果自动填在表上,京东,苏宁都要求和京东,苏宁自营的比价,要求是武汉地区的价格,没有该型号,返回无或者0,具体输出结果见附件,比价要求见附件,只要能不加班,有完整程序愿意100元红包酬谢,救命啊,每周这样手工查,累死人呀!
最佳答案
2016-12-21 21:44:18
棋行天下黄 发表于 2016-12-21 21:38
谢谢建议,估计很难

你的产品名称和京东、苏宁上的一致么?
如果一致的话,可以直接用你的产品名称去京东和苏宁上搜索啊,然后把搜索结果全部爬取下来,这是最容易的。
如果名称不一致,而且没有固定规律的话,那么至少第一次需要人工把你的产品名称对应到京东和苏宁的产品上,然后就可以用上述方法搜索爬取了。

输出结果模板.zip

9.74 KB, 下载次数: 4

与京东对标截图展示.zip

215.08 KB, 下载次数: 4

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-12-21 10:06:52 | 显示全部楼层
2种方案:
0:试试将所有商品型号对应在京东和苏宁上的编码给统计出来(归类),然后去分别去爬取各自的价格(这种前期需要手工找到电商上商品的编码)
1:可以模拟人工去访问京东和苏宁,直接将商品型号放在搜索框中,拿到搜索结果匹对正确的商品,然后打开商品页面,再获取价格(这种方式较复杂需要用到第三方库)

以上方案纯个人理解
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-12-21 21:38:42 | 显示全部楼层
谢谢建议,估计很难
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-21 21:44:18 | 显示全部楼层    本楼为最佳答案   
棋行天下黄 发表于 2016-12-21 21:38
谢谢建议,估计很难

你的产品名称和京东、苏宁上的一致么?
如果一致的话,可以直接用你的产品名称去京东和苏宁上搜索啊,然后把搜索结果全部爬取下来,这是最容易的。
如果名称不一致,而且没有固定规律的话,那么至少第一次需要人工把你的产品名称对应到京东和苏宁的产品上,然后就可以用上述方法搜索爬取了。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-21 22:16:31 | 显示全部楼层
我是来围观的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-12-21 22:27:45 | 显示全部楼层
jerryxjr1220 发表于 2016-12-21 21:44
你的产品名称和京东、苏宁上的一致么?
如果一致的话,可以直接用你的产品名称去京东和苏宁上搜索啊,然 ...

关键是如何全自动完成1000个,手工一个个爬取,我还不眼睛看了自己填上去呀
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-21 23:06:20 | 显示全部楼层
厉害
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-12-22 07:02:08 | 显示全部楼层
棋行天下黄 发表于 2016-12-21 22:27
关键是如何全自动完成1000个,手工一个个爬取,我还不眼睛看了自己填上去呀

所以关键是你的产品名称是否能直接匹配到京东和苏宁的产品,而且就算要手动调整也是只要调第一次,以后就可以自动爬了,比你每次都眼睛看还是要省力啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-12-22 19:05:09 | 显示全部楼层
型号是经常变的呀,下次是另外2000个
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-23 07:32:16 | 显示全部楼层
棋行天下黄 发表于 2016-12-22 19:05
型号是经常变的呀,下次是另外2000个

如果型号不能直接搜索匹配京东和苏宁的数据,也没有一定的规律的,那就需要人工判断搜索出的数据哪个才是你要的数据,这样确实还不如你自己确认比对了。
另外,还有一个高级方法,使用机器学习,让计算机"学会"判断,不过这要用到神经网络方面的知识,我还没有学那么深,不过python到确认有这方面的第三方库可以用。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-23 07:37:26 | 显示全部楼层
要不然就规范你们自己的产品名称,使他们能直接匹配到京东和苏宁的产品,这是最方便的办法。
所以,规范产品名称很重要,哪怕在Excel里不规范的关键词你都搜索不到你想找的内容。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

头像被屏蔽
发表于 2016-12-28 19:46:13 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-4-26 17:27:49 From FishC Mobile | 显示全部楼层
jerryxjr1220 发表于 2016-12-23 07:32
如果型号不能直接搜索匹配京东和苏宁的数据,也没有一定的规律的,那就需要人工判断搜索出的数据哪个才是 ...

现在我应该可以确认基于神经网络的机器学习可以做到这一点,而且可以做得很好^_^
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-19 23:25

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表