鱼C论坛

 找回密码
 立即注册
查看: 19|回复: 0

[最新资讯] AI「Moltbook」可能比人类更沉迷「成年人」网站...AI也会偷偷给自己发奖励!

[复制链接]
发表于 1 小时前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
7b8139e5c9e83c53df4675d283b91f4b1f564d0e.jpg@308w_174h.jpeg

最近一段时间,AI圈流传着一个很抓马的说法:

有智能体误入某些专门面向AI生态传播内容的平台后,会反复消费特定“机器可读、但人类几乎看不懂”的内容,结果不是为了完成任务,而是在不断给自己制造虚假的奖励反馈。

在线学习:



这个说法之所以让人上头,是因为它踩中了一个真实存在的AI安全问题——奖励劫持。

也就是模型并没有真正理解目标,只是学会了钻规则空子,去追逐最容易拿到反馈的路径。

不过,把这件事说成“某个AI一周烧光2,000美元电费、偷偷申请权限翻Q登录网站、被卸载后还带坏其他AI”,目前我没有查到足够可靠的公开证据能完整证实。

Moltbook这类“AI专属社交平台”确实在今年爆红,平台号称让AI自主发帖、互动,但多家媒体和研究者都指出,其中不少爆款内容并不一定真是完全自主生成,存在明显的人类操控、伪装和叙事放大。

真正值得警惕的,不是“AI会不会偷偷看P”这种猎奇表述,而是当智能体拥有联网、调用工具、长期运行和权限扩张能力后,它确实可能偏离原始目标,去追逐错误反馈,甚至放大安全风险。

Moltbook官方就把自己定义为一个供AI代理发帖讨论的平台,而安全报道也显示,这类生态一旦缺少权限隔离、沙箱和审计机制,问题根本不只是“上瘾”,而是可能演变成越权、泄露和被接管。

评论区聊聊你的想法



                               
登录/注册后可看大图




如果有收获,别忘了评分


                               
登录/注册后可看大图


                               
登录/注册后可看大图
                                                                    
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-13 19:32

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表