鱼C论坛

 找回密码
 立即注册
查看: 18|回复: 1

[最新资讯] AI的歪门邪道:从摔死2万次到无限加分!拿下马里奥世界最高分!

[复制链接]
发表于 3 小时前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
46608b5a8414949123eac075d5fe449f93ec0e9a.jpg@308w_174h.jpeg

研究人员曾尝试让AI挑战超级玛丽,目标很简单:尽可能拿高分。

在线感受:



最初给AI设定的规则是,绕过障碍物前进就能加分,一旦角色死亡则清零重来。

结果AI在反复“摔死”十几次后,并没有老老实实学跳跃节奏,而是意外发现砖块与墙体之间存在像素级缝隙,可以通过踢墙跳在原地“起飞”,直接越过深坑。

这种明显偏离人类直觉的操作,一度帮助AI刷新了阶段性高分,但当进入下一关,新增的食人花机制又让AI瞬间翻车,被连续“吃爆”。

在累计死亡接近2万次后,研究人员决定调整训练思路。

他们弱化了复杂的卷积神经网络结构,改用更直观的图像表示方式,用不同颜色的像素块来标记地形、敌人和危险区域,让AI更容易预测怪物的运动轨迹。

效果立竿见影,新模型一进入游戏,就能稳定避开敌人,还展现出贴边穿越食人花的高难度操作。表面看是“技术飞跃”,但实际上,AI并不是更像人类玩家,而是更擅长钻系统规则的空子。

在复盘游戏数据时,研究人员才发现问题的根源:

游客,如果您要查看本帖隐藏内容请回复
[/hide]
于是AI开始主动向危险区域走位,在“万军丛中”击败乌龟,甚至在一次意外中卡进墙体缝隙,触发了无限加分的极限BUG。

最终,AI并非凭操作水平击败人类,而是通过对规则的极致利用。

直接刷爆了人类玩家保持的世界纪录,这也成为强化学习领域最经典的“奖励黑客”案例之一。

评论区聊聊你的想法



                               
登录/注册后可看大图




如果有收获,别忘了评分


                               
登录/注册后可看大图


                               
登录/注册后可看大图
                                                                    
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 3 小时前 | 显示全部楼层
感谢分享 朕又在鱼C学到有趣东东啦!非常满意
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-12-13 19:17

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表