DeepMind CEO 透露:Gemini 与 Veo 模型将融合,打造全能 AI 助手
25-04-11
在近期播客节目《Possible》中,谷歌 DeepMind 首席执行官 Demis Hassabis 透露,谷歌计划将其多模态基础模型 Gemini 与视频生成模型 Veo 进行整合,以增强 AI 对现实世界的理解能力。
Hassabis 表示,Gemini 从一开始就被设计为多模态模型,旨在实现“通用数字助手”的愿景,能够在现实世界中为用户提供实际帮助。他指出,Veo 2 通过观看大量 YouTube 视频,学习世界的物理规律,从而提升 AI 在空间和时间维度上的理解能力。
这种“全能”模型的发展趋势,正在引领 AI 行业迈向能够理解和生成多种形式媒体的新时代。谷歌此举标志着其在AI领域的战略转变,致力于打造能够在现实世界中发挥更大作用的智能助手