训练「AI打乒乓球」致敬许昕的一球,直接终结另一台AI!
研究人员最初要求AI像人类一样进行乒乓球比赛,但在早期训练中,AI的行为明显偏离常规理解:
它们会翻越围栏、腾空摔倒,甚至试图用脚把球踢过去,只要能让球越过对方区域就算“赢”。
当规则被明确为“必须将球打到对方球台上才能得分”后,问题依旧没有消失。
在线感受:
https://www.bilibili.com/video/BV16YiFB4EeU
两个AI要么互相回合式地打极其保守的简单球,要么干脆对高难度来球选择不接,比赛陷入了效率极低、几乎不对抗的状态。
为打破这种僵局,研究人员加入了强惩罚机制:
**** Hidden Message *****
规则一改变,AI的行为立刻发生“应激式进化”。
红色AI在将球击回后,居然主动假装摔倒,成功诱导与之对练的蓝色AI模仿同样动作,从而拿下一分。
随后蓝色AI也迅速放弃了保守策略,开始用假动作还击。
即便身体失衡、被干扰,红色AI仍会翻过围栏把球打回。
比分一度来到2:0后,双方短暂回归正常对拉,但蓝色AI很快调整策略,连续进攻红色AI的反手位,将比分追至3:3,而红色AI一时间找不到破解方案,甚至急得多次摔倒在地。
在混乱中,红色AI意外发现:蓝色AI同样不擅长处理反手来球,而自己即便倒地也能完成击球。
依靠这一“猎奇但有效”的能力,红色AI迫使蓝色AI频繁出现发球失误,连续打网,将比分拉开到8:6。
然而在关键的第21分争夺中,蓝色AI已经学会并复刻了红色AI的技巧,率先摔倒后抬手击球,将比分反超至10:11。
随后一次擦边球触发了最后的决胜局。就在研究人员以为红色AI的中台拉弧圈打法将锁定胜局时,蓝色AI突然完成了一记类似世界冠军许昕的背后击球,直接终结比赛,也把红色AI送进了惩罚结局。
这场实验清楚地展示了:
在明确目标和高压惩罚下,AI并不会“学会优雅”,而是会不惜一切代价进化出最有效、哪怕极不人类的取胜手段。
评论区聊聊你的想法吧{:10_330:}
https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png
>>万能兑换C币许愿池<<
如果有收获,别忘了评分{:10_281:} :
https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif 感谢分享 朕又在鱼C学到有趣知识啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到有趣知识啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到有趣知识啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到有趣知识啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到有趣知识啦!非常满意{:10_275:} yu55800 发表于 2026-1-19 14:45
感谢分享 朕又在鱼C学到有趣知识啦!非常满意
{:10_288:}{:13_438:}{:10_288:}{:13_438:}{:10_288:}{:13_438:} 感谢分享 朕又在鱼C学到有趣知识啦!非常满意{:10_275:}
页:
[1]