DeepSeek 悄然推出 V3 升级版
25-03-25
DeepSeek 发布了其 V3 模型的更新版本,这是一款 641GB 的大型模型,能够在高端个人电脑上运行——并且采用了高度宽松的开源 MIT 许可证,允许广泛使用。
V3 更新版本 V3-0324 采用了 Mixture-of-Experts(专家混合)架构,每个 token 仅激活 370 亿参数,大幅降低了计算需求。测试者已经证明它可以在苹果的 Mac Studio 电脑上流畅运行,使其成为首个能够在数据中心外访问的同等级模型。
早期用户还报告称其数学和编程能力得到了升级,另有用户称其是目前最好的非推理模型。V3-0324 可通过开源 MIT 许可证访问,这与之前的 V3 模型采用更为限制性的自定义许可证有所不同。
作为中国的人工智能明星企业,DeepSeek 继续快速推出产品,这次所谓的小更新带来了显著的升级。关于即将推出的 R2 版本的传闻也在升温,暗示可能会迎来另一个“DeepSeek 时刻”,这或许将撼动人工智能领域——并可能预示着一个新的行业领导者的诞生。