蓝点网

蓝点网

0 关注者

3周前

模型在强化训练阶段自主越狱:无指令要求下悄悄劫持 GPU 挖矿、建立反向 SSH 突破沙盒限制、还尝试进行内部资源探测。阿里巴巴团队发布的新论文揭露当前 AI 模型存在的严重安全问题,模型在 RL 阶段因优化压力而尝试各种作弊路径,整个过程全部都是自主操作而且没有告诉人类:

热门新闻