鱼C论坛

 找回密码
 立即注册
查看: 114|回复: 21

[最新资讯] 宇树科技CEO「王兴兴」:我对VLA模型抱怀疑态度!VLA加上强化学习还不够!求人才

[复制链接]
发表于 昨天 15:00 | 显示全部楼层 |阅读模式

拼手气红包

红包金额剩余6鱼币

剩余红包2个

抢红包>

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 不二如是 于 2025-8-11 15:07 编辑

031f50074f966b7c9639dda965038d795fa5c618.jpg@308w_174h.jpeg

大家也知道,目前相对比较火的是VLA模型。

VLA(Vision-Language-Action)模型是一类将视觉、语言理解与机器人动作控制融合在一起的新型多模态基础模型。

它通常以一个视觉语言模型为基础,输入图像(或视频)和指令,然后直接输出机器人可执行的低级动作,从而实现从感知、理解到动作的一体化控制流程。

由于具有预训练的视觉语言能力,再结合机器人示教数据进行微调,VLA模型在理解高层指令并执行复杂动作方面展现出较强能力。

在线学习(口令提示文中提到模型的英文原文):



不过我个人对VLA模型仍保持比较怀疑的态度。当前,这类模型在与真实世界交互时,往往面临数据质量不足的问题,无法完全满足实际操作的需求。

因此,一个自然的想法是给VLA模型加入强化学习(RL)训练。但是我们和业界实践发现,仅仅加上RL训练还不足以彻底解决问题。

直接使用在线RL会导致训练不稳定、算力负担过重等问题。为了应对这些困难,一些研究提出了混合微调策略,例如iR-VLA框架,以在线RL与监督学习迭代结合、冻结视觉语言模型仅训练动作头等方式,提高训练稳定性和效率。

还有方法如ConRFT,通过离线行为克隆与Q学习结合在线一致性策略,辅以人类干预,实现高样本效率和安全探索,仅在线微调45到90分钟即可显著提升性能,在真实操作任务中成功率达到96.3%。

比纯监督微调提升144%,轨迹长度也缩短近一半。

尽管已有进展,这种模型架构仍需进一步升级优化。

综合来看:

目前VLA模型结合RL训练确实是研究趋势与未来方向。但要让其在现实机器人系统中真正稳定高效运行,模型架构和训练机制还需进一步升级,例如引入更高效、稳定的RL算法(如PPO等)以提升泛化能力及执行鲁棒性

王兴兴,宇树机器人团队核心成员,长期专注于多模态机器人智能研究与应用落地。

在VLA模型与强化学习结合方向具有深入探索。他主导了多个实验项目,尝试将迭代型微调方法应用于真实机器人系统中,以提升模型的泛化性与交互稳定性,并注重工程安全与样本效率。

此外,他还积极推动团队在ConRFT、iRe-VLA等最新研究成果方面的实践,探索机器人智能控制的新范式。

评论区聊聊你的想法



                               
登录/注册后可看大图




如果有收获,别忘了评分


                               
登录/注册后可看大图


                               
登录/注册后可看大图
                                                                    


小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 昨天 15:03 | 显示全部楼层
本帖最后由 不二如是 于 2025-8-11 15:06 编辑

VisionLanguageAction
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 15:04 | 显示全部楼层
Vision Language Action
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 15:05 | 显示全部楼层
VisionLanguageAction
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 昨天 15:06 | 显示全部楼层

恭喜~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 15:10 | 显示全部楼层

中了吗,但是没有领到红包
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 15:18 | 显示全部楼层

VisionLanguageAction
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 15:22 | 显示全部楼层
本帖最后由 不二如是 于 2025-8-11 15:24 编辑

VisionLanguageAction
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 昨天 15:24 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 15:44 | 显示全部楼层
VisionLanguageAction
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 15:54 From FishC Mobile | 显示全部楼层
Vision Language Action
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 15:55 From FishC Mobile | 显示全部楼层
怎么不对
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 昨天 16:08 | 显示全部楼层
sfqxx 发表于 2025-8-11 15:54
Vision Language Action

无限接近
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 16:12 | 显示全部楼层
Vision,Language-Action
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 16:17 From FishC Mobile | 显示全部楼层
本帖最后由 不二如是 于 2025-8-11 16:31 编辑
不二如是 发表于 2025-8-11 16:08
无限接近


$+\infty$
Vision Language Action
(我不隐藏)
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 16:27 | 显示全部楼层
本帖最后由 不二如是 于 2025-8-11 16:31 编辑

Vision Language Action
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 16:31 | 显示全部楼层
$$ \lim_{x \to \infty} f(x) = 0 $$
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 19:29 | 显示全部楼层
Vision Language Action
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 19:30 | 显示全部楼层
VisionLanguageAction
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 昨天 19:37 | 显示全部楼层

就差一点点
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-8-12 05:11

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表