Anthropic CEO:AI 可能在 2027 年前后超越人类
25-04-25
Anthropic 的联合创始人兼 CEO Dario Amodei 发布了一篇题为《The Urgency of Interpretability》的文章,强调了当前 AI 模型内部机制的不透明性,并提出到 2027 年实现对大多数 AI 模型问题的可靠检测的目标。他指出,尽管 AI 模型在性能上取得了显著进步,但我们对其决策过程的理解仍然有限,这在经济、技术和国家安全等领域引发了广泛关注 。
Amodei 表示,Anthropic 已在追踪模型决策路径方面取得初步突破,例如识别帮助 AI 模型理解美国城市与州之间关系的“电路”。然而,他强调,仍需进行大量研究,以实现对这些系统的深入解码。他提出,未来可能需要对先进的 AI 模型进行类似“脑部扫描”或“核磁共振”的检查,以识别模型可能存在的撒谎、寻求权力等问题 。
Amodei 预测,AI 技术可能在 2027 年前后在大多数任务上超越人类能力,这将对经济和社会结构产生深远影响。他呼吁在部署具备高度自主性的 AI 系统之前,必须深入理解其内部运作机制,以确保技术的安全性和可控性 。Anthropic 的这一战略强调了 AI 可解释性研究的重要性,旨在为未来更安全、透明的 AI 系统奠定基础。随着 AI 技术的快速发展,确保其可理解性和可控性已成为行业亟需解决的关键问题。