12月5日消息,单张谷歌DeepMind日前推出了其最新的图生基础世界模型——Genie 2,通过一张图像或文字描述,世界世界生成斯克就能生成可供人类或AI智能体游玩的谷歌3D场景。 谷歌表示,虚拟线还戏用户只需提供一张由Imagen 3生成的器上图像和相应的文字描述,Genie 2便能生成一个可交互的和马3D环境,用户可以通过鼠标和键盘在其中自由探索,联手最长可持续一分钟。单张 该模型不仅能够保持生成环境的图生一致性,还能在用户移动时准确呈现视野中消失的世界世界生成斯克部分。 谷歌还表示,谷歌Genie2在生成过程中能够模拟物体交互、虚拟线还戏动画、器上光照、和马物理反射以及NPC的行为,许多生成的场景画质接近3A级别的游戏,甚至在物体视角一致性和场景记忆方面表现优异。 有人被这技术进步的速度震撼,称之为视频游戏的未来,甚至还有人看到了一切都被虚拟化的世界模型的更长远未来。 值得一提的是,Genie 2发布后,DeepMind CEO邀请马斯克一起制作AI游戏,马斯克则回复:Cool。 谷歌研究人员Jack Parker-Holder也给出了两个实例,其中,一张图上有一个红门和一个蓝门,向模型输入不同的语言指令,可以生成不同的3D场景,走向红门或蓝门。 在更复杂的三门场景中,Genie 2依然很好地理解了指令并生成了研究人员想要的3D动图。 |