谷歌 DeepMind 最近宣布了名为「Genie 2」的大规模基础世界模型 (world models),这是一款能够根据单张图片和文字描述生成可玩 3D 世界的新模型,标志着人工智能在虚拟世界创建领域的一大进步。

最新的 Genie 2 能够实时创建出具有不同视角和互动性的三维场景,还能够模拟物体交互、动画、光照、物理反射以及 NPC 行为等等,并且生成的场景画质接近 3A 大作。

值得一提的是,该模型不仅能够记住不在视野范围内的场景部分,并在它们再次可见时准确地渲染它们,还能够维持长达一分钟的场景连贯性,动态生成新的合理内容。
Genie 2 的应用范围相当广泛,包括快速原型设计、AI 智能体评估等,为研究人员快速生成多样化的环境提供了一个强大工具,能够为未见过的任务场景提供评估支持。
谷歌 DeepMind 称,Genie 2 可以让未来的 AI 代理在一个充满了无限可能性和探索的空间中训练和评估,为原型交互体验的全新创意工作流铺平了道路。
尽管 Genie 2 的研究仍处于初期,但它在训练具身智能体和推动通用人工智能(AGI)发展方面展现出了巨大的潜力。
更多独家技术见解与热门话题讨论,尽在【开源中国 APP】,与数百万开发者一起,随时随地探索技术无限可能。
暂无更多评论