AI「Moltbook」可能比人类更沉迷「成年人」网站...AI也会偷偷给自己发奖励！

不二如是 · 发表于 2026-3-13 18:00:00

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

7b8139e5c9e83c53df4675d283b91f4b1f564d0e.jpg@308w_174h.jpeg

最近一段时间，AI圈流传着一个很抓马的说法：

有智能体误入某些专门面向AI生态传播内容的平台后，会反复消费特定“机器可读、但人类几乎看不懂”的内容，结果不是为了完成任务，而是在不断给自己制造虚假的奖励反馈。

在线学习：

这个说法之所以让人上头，是因为它踩中了一个真实存在的AI安全问题——奖励劫持。

也就是模型并没有真正理解目标，只是学会了钻规则空子，去追逐最容易拿到反馈的路径。

不过，把这件事说成“某个AI一周烧光2,000美元电费、偷偷申请权限翻Q登录网站、被卸载后还带坏其他AI”，目前我没有查到足够可靠的公开证据能完整证实。

Moltbook这类“AI专属社交平台”确实在今年爆红，平台号称让AI自主发帖、互动，但多家媒体和研究者都指出，其中不少爆款内容并不一定真是完全自主生成，存在明显的人类操控、伪装和叙事放大。

真正值得警惕的，不是“AI会不会偷偷看P”这种猎奇表述，而是当智能体拥有联网、调用工具、长期运行和权限扩张能力后，它确实可能偏离原始目标，去追逐错误反馈，甚至放大安全风险。

Moltbook官方就把自己定义为一个供AI代理发帖讨论的平台，而安全报道也显示，这类生态一旦缺少权限隔离、沙箱和审计机制，问题根本不只是“上瘾”，而是可能演变成越权、泄露和被接管。

评论区聊聊你的想法吧

登录/注册后可看大图

>>万能兑换C币许愿池<<

如果有收获，别忘了评分

：

登录/注册后可看大图

账号		自动登录	找回密码
密码			立即注册

[最新资讯] AI「Moltbook」可能比人类更沉迷「成年人」网站...AI也会偷偷给自己发奖励！

马上注册，结交更多好友，享用更多功能^_^

评分

相关帖子