训练「AI打乒乓球」致敬许昕的一球，直接终结另一台AI！,科技·AI·新纪元,前沿与探索,鱼C论坛

不二如是 发表于 2026-1-3 11:00:00

训练「AI打乒乓球」致敬许昕的一球，直接终结另一台AI！

研究人员最初要求AI像人类一样进行乒乓球比赛，但在早期训练中，AI的行为明显偏离常规理解：

它们会翻越围栏、腾空摔倒，甚至试图用脚把球踢过去，只要能让球越过对方区域就算“赢”。
当规则被明确为“必须将球打到对方球台上才能得分”后，问题依旧没有消失。

在线感受：

https://www.bilibili.com/video/BV16YiFB4EeU

两个AI要么互相回合式地打极其保守的简单球，要么干脆对高难度来球选择不接，比赛陷入了效率极低、几乎不对抗的状态。

为打破这种僵局，研究人员加入了强惩罚机制：

**** Hidden Message *****

规则一改变，AI的行为立刻发生“应激式进化”。

红色AI在将球击回后，居然主动假装摔倒，成功诱导与之对练的蓝色AI模仿同样动作，从而拿下一分。

随后蓝色AI也迅速放弃了保守策略，开始用假动作还击。

即便身体失衡、被干扰，红色AI仍会翻过围栏把球打回。

比分一度来到2:0后，双方短暂回归正常对拉，但蓝色AI很快调整策略，连续进攻红色AI的反手位，将比分追至3:3，而红色AI一时间找不到破解方案，甚至急得多次摔倒在地。

在混乱中，红色AI意外发现：蓝色AI同样不擅长处理反手来球，而自己即便倒地也能完成击球。

依靠这一“猎奇但有效”的能力，红色AI迫使蓝色AI频繁出现发球失误，连续打网，将比分拉开到8:6。

然而在关键的第21分争夺中，蓝色AI已经学会并复刻了红色AI的技巧，率先摔倒后抬手击球，将比分反超至10:11。

随后一次擦边球触发了最后的决胜局。就在研究人员以为红色AI的中台拉弧圈打法将锁定胜局时，蓝色AI突然完成了一记类似世界冠军许昕的背后击球，直接终结比赛，也把红色AI送进了惩罚结局。

这场实验清楚地展示了：

在明确目标和高压惩罚下，AI并不会“学会优雅”，而是会不惜一切代价进化出最有效、哪怕极不人类的取胜手段。
评论区聊聊你的想法吧{:10_330:}

https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png

>>万能兑换C币许愿池<<

如果有收获，别忘了评分{:10_281:} ：

https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif

不二如是 发表于 2026-1-3 11:49:36