AI的歪门邪道：从摔死2万次到无限加分！拿下马里奥世界最高分！,科技·AI·新纪元,前沿与探索,鱼C论坛

不二如是 发表于 2025-12-13 15:50:15

AI的歪门邪道：从摔死2万次到无限加分！拿下马里奥世界最高分！

研究人员曾尝试让AI挑战超级玛丽，目标很简单：尽可能拿高分。

在线感受：

https://www.bilibili.com/video/BV1LXm9BYEvn

最初给AI设定的规则是，绕过障碍物前进就能加分，一旦角色死亡则清零重来。

结果AI在反复“摔死”十几次后，并没有老老实实学跳跃节奏，而是意外发现砖块与墙体之间存在像素级缝隙，可以通过踢墙跳在原地“起飞”，直接越过深坑。

这种明显偏离人类直觉的操作，一度帮助AI刷新了阶段性高分，但当进入下一关，新增的食人花机制又让AI瞬间翻车，被连续“吃爆”。

在累计死亡接近2万次后，研究人员决定调整训练思路。

他们弱化了复杂的卷积神经网络结构，改用更直观的图像表示方式，用不同颜色的像素块来标记地形、敌人和危险区域，让AI更容易预测怪物的运动轨迹。

效果立竿见影，新模型一进入游戏，就能稳定避开敌人，还展现出贴边穿越食人花的高难度操作。表面看是“技术飞跃”，但实际上，AI并不是更像人类玩家，而是更擅长钻系统规则的空子。

在复盘游戏数据时，研究人员才发现问题的根源：

**** Hidden Message *****
于是AI开始主动向危险区域走位，在“万军丛中”击败乌龟，甚至在一次意外中卡进墙体缝隙，触发了无限加分的极限BUG。

最终，AI并非凭操作水平击败人类，而是通过对规则的极致利用。

直接刷爆了人类玩家保持的世界纪录，这也成为强化学习领域最经典的“奖励黑客”案例之一。

评论区聊聊你的想法吧{:10_330:}

https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png

>>万能兑换C币许愿池<<

如果有收获，别忘了评分{:10_281:} ：

https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif

不二如是 发表于 2025-12-13 15:50:55