World Labs 的 AI 能从单张照片生成互动 3D 场景

24-12-04

免费

快讯

由 AI 先驱李飞飞创立的初创公司 World Labs 最近展示了其首个项目：一个能够从单一图像生成类似电子游戏的 3D 场景的 AI 系统。这个系统不仅能够将照片转换成 3D 模型和环境，而且这些场景是可交互和可修改的。用户可以在 World Labs 网站上通过键盘和鼠标探索这些 AI 生成的场景，这些场景虽然是实时在浏览器中渲染的，并且具有可控的相机和可调的模拟景深（DoF）。DoF 效果越强，背景物体看起来就越模糊。

World Labs 的技术允许用户“步入任何图像并在 3D 中探索它”，所有内容除了输入图像外都是生成的。这些场景属于新兴的 AI 领域“世界模型”的一部分，这些模型能够模拟游戏和 3D 环境，但通常存在人工制品和一致性问题。与此相反，World Labs 的方法确保一旦场景生成后保持不变，并且它们遵循基本的物理定律，意味着它们具有实体感和深度。

此外，World Labs 的系统还可以对场景应用交互式效果和动画，比如改变物体的颜色和动态照明背景。尽管大多数生成的 AI 工具制作 2D 内容，如图像或视频，但 World Labs 认为在 3D 中生成可以提高控制和一致性，这将改变我们制作电影、游戏、模拟器和其他数字表现形式的方式。

目前，World Labs 的场景并非完全可探索，用户移动受限于一个小区域，偶尔也会出现渲染错误，例如物体以不自然的方式融合在一起。但 World Labs 表示，目前展示的只是一个“早期预览”，公司正在努力提高生成世界的尺寸和保真度，并尝试新的用户交互方式。

World Labs 今年早些时候成立，已经从包括 Andreessen Horowitz（a16z）、Ashton Kutcher、Intel Capital、AMD Ventures 和 Eric Schmidt 在内的投资者那里筹集了 2.3 亿美元的风险资本，公司估值超过 10 亿美元，希望在 2025 年推出其首个产品。除了交互式场景外，World Labs 还计划构建可能对艺术家、设计师、开发人员、电影制作人和工程师等专业人士有用的工具，目标客户从视频游戏开发商到电影制片厂。

Memo Team

Signal, not noise!

World Labs 的 AI 能从单张照片生成互动 3D 场景

Memo Newsletter