鱼C论坛

 找回密码
 立即注册
查看: 90|回复: 1

[数据结构] 如何训练AI【悬赏】

[复制链接]
发表于 昨天 20:24 | 显示全部楼层 |阅读模式
10鱼币
有大佬能教我如何训练自动爬虫+DeepSeek或chatgpt接口迅速分析的AI嘛

目前等级比较低所以没法给太多育碧,只能10个,但是如果把我教会了肯定给你补满100鱼币,能找管理员作证
要为下个月的大赛做准备,到时候题目不确定,但是差不多类似的,也没找到能教明白我的人

主要目标是设计一个图形化程序,能够从亚马逊,shoppee和淘宝三个平台上,爬虫获取任何旗下的任何商品的,在三年内任意月份的所有购后评论,然后对评论进行分类,打个比方,按照经济学的基本保健因素(产品质量,物流时效,包装完好性,平台/支付安全感),期望类功能性需求(价格与性价比,售后与客服响应,使用便利度,比如说明书好不好理解啥的)

然后给商家10个以内的优化建议(就是分析综合问题)
这期间就免不了要从很多纯属泄愤,玩梗和就说一个什么什么很差,的评论里跳出来有意义的东西,所以就要用到AI机器学习。

而且搜索要精准,亚马逊平台维护的比较好基本都是正版,但是淘宝上就有很多二手贩子了,那个就要避开,只要旗舰店和官方店。

我目前准备了亚马逊,shoppee和淘宝每个平台300万条评论作为训练集和测试集。都是从kaggle和github上找到的,理论上讲没什么问题。
就是不知道接下来怎么实操(我学理论课程以来这回是第一次实操)。

实现方法要编写一个图形化程序,有几个询问框
第一个是问你搜那个公司,品牌或者集团的,比如大疆无人机或者苹果
第二个是问你想要搜的品类或者品名,比如苹果16promax,大疆第五代能从水里起飞那个(我也不知道叫啥
第三个是问你想搜哪个平台,只能上面那三个选,或者都选,其他的京东啥的那就不行
第四个是问你时间范围,三年内随便你选,比如6个月内的,2个月内的,或者也可以指定时间,比如三年内某一年的几月到几月,比如(2024.6.7 - 2025.8.9)精确到日的那种(这个应该不难,精确到小时到分钟应该都没啥问题

然后开始爬虫搜索,搜完以后按照我们事先训练好的AI来分析处理(这个我不确定是否还要外接一个chatgpt或者deepseek了,还是说要自己手搓一个AI,反正我也有训练集和测试集)

deepseek专业版本团队版本满配的接口我拿到了,这个不需要担心,比赛服账号,开赛前一个月到开赛后3天都可以使用,用来练习什么的

想看看有没有大佬能教教我怎么具体实现,带带我做第一次实操(虽然题目是我自己编的和实际比赛估计有不小差别)
什么数据清洗投喂爬虫(爬虫还得小心点别ip给封了

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 昨天 20:27 | 显示全部楼层
很类似我以前和tyh一起弄的chatgpt回答
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-8-20 16:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表