Anthropic CEO：AI 可能在 2027 年前后超越人类

25-04-25

免费

快讯

Anthropic 的联合创始人兼 CEO Dario Amodei 发布了一篇题为《The Urgency of Interpretability》的文章，强调了当前 AI 模型内部机制的不透明性，并提出到 2027 年实现对大多数 AI 模型问题的可靠检测的目标。他指出，尽管 AI 模型在性能上取得了显著进步，但我们对其决策过程的理解仍然有限，这在经济、技术和国家安全等领域引发了广泛关注。

Amodei 表示，Anthropic 已在追踪模型决策路径方面取得初步突破，例如识别帮助 AI 模型理解美国城市与州之间关系的“电路”。然而，他强调，仍需进行大量研究，以实现对这些系统的深入解码。他提出，未来可能需要对先进的 AI 模型进行类似“脑部扫描”或“核磁共振”的检查，以识别模型可能存在的撒谎、寻求权力等问题。

Amodei 预测，AI 技术可能在 2027 年前后在大多数任务上超越人类能力，这将对经济和社会结构产生深远影响。他呼吁在部署具备高度自主性的 AI 系统之前，必须深入理解其内部运作机制，以确保技术的安全性和可控性。Anthropic 的这一战略强调了 AI 可解释性研究的重要性，旨在为未来更安全、透明的 AI 系统奠定基础。随着 AI 技术的快速发展，确保其可理解性和可控性已成为行业亟需解决的关键问题。

Memo Team

Signal, not noise!

Anthropic CEO：AI 可能在 2027 年前后超越人类

Memo Newsletter