Genie (全称:Generative Interactive Environments,生成式交互环境),是谷歌DeepMind团队发布的一个AI模型,于2024年2月26日发布(注:相关论文发表于2月23日)。Genie是从互联网视频中训练出来的基础世界模型,可根据合成图像、照片、草图生成动作可控的2D世界。Genie拥有110亿个参数,由三个部分组成:一个潜在动作...
IT之家 2 月 27 日消息,谷歌旗下的 DeepMind 团队近日推出 Genie 的全新 AI 模型,共有 110 亿个参数,能够基于用户输入的一张图片和提示词,生成一款较为完整的 2D 平台游戏。Genie 通过了网络上超过 20 万小时的 2D 游戏视频训练,目前只是一个研究预览版,这些游戏更像是 2D 平台游戏,而不是完全的 VR...
IT之家 2 月 27 日消息,谷歌旗下的 DeepMind 团队近日推出 Genie 的全新 AI 模型,共有 110 亿个参数,能够基于用户输入的一张图片和提示词,生成一款较为完整的 2D 平台游戏。 Genie 通过了网络上超过 20 万小时的 2D 游戏视频训练,目前只是一个研究预览版,这些游戏更像是 2D 平台游戏,而不是完全的 VR 游戏。
OpenAI 最近公布了其令人惊叹的视频生成模型 Sora,打破了文本到视频生成模型的天花板。近日,谷歌 DeepMind 也展示了最新的文本到视频游戏的生成模型。(来源:GOOGLE DEEPMIND)这款名为 Genie 的新模型可以接受简短的文字描述、手绘草图或图片,并将其变成一款可玩的电子游戏,游戏风格类似于超级马里奥等经典的 2D 平...
IT之家2 月 27 日消息,谷歌旗下的 DeepMind 团队近日推出 Genie 的全新 AI 模型,共有 110 亿个参数,能够基于用户输入的一张图片和提示词,生成一款较为完整的 2D 平台游戏。 Genie 通过了网络上超过 20 万小时的 2D 游戏视频训练,目前只是一个研究预览版,这些游戏更像是 2D 平台游戏,而不是完全的 VR 游戏...
IT之家 2 月 27 日消息,谷歌旗下的 DeepMind 团队近日推出 Genie 的全新 AI 模型,共有 110 亿个参数,能够基于用户输入的一张图片和提示词,生成一款较为完整的 2D 平台游戏。 Genie 通过了网络上超过 20 万小时的 2D 游戏视频训练,目前只是一个研究预览版,这些游戏更像是 2D 平台游戏,而不是完全的 VR 游...
·Genie是从互联网视频中训练出来的基础世界模型,可根据合成图像、照片、草图生成动作可控的2D世界。不过其生成的“游戏”画质很糊,离实时可玩还很远。 ·DeepMind认为,Genie引入了一个能从图像或文本生成整个交互式世界的时代,它将成为训练未来通才AI智能体的催化剂。
IT之家 2 月 27 日消息,谷歌旗下的 DeepMind 团队近日推出 Genie 的全新 AI 模型,共有 110 亿个参数,能够基于用户输入的一张图片和提示词,生成一款较为完整的 2D 平台游戏。 Genie 通过了网络上超过 20 万小时的 2D 游戏视频训练,目前只是一个研究预览版,这些游戏更像是 2D 平台游戏,而不是完全的 VR 游...
【#谷歌DeepMind推出Genie模型# :110 亿个参数,基于图片和提示词生成2D游戏】谷歌旗下的 DeepMind 团队近日推出 Genie 的全新 AI 模型,共有 110 亿个参数,能够基于用户输入的一张图片和提示词,生成一款较为...
谷歌 DeepMind Genie 团队负责人蒂姆-罗克塔谢尔(Tim Rocktäschel)在 X 上写道,团队重点关注规模问题,使用的数据集由超过 20 万小时的 2D 平台游戏视频组成。它是在无监督和无标签视频的情况下进行训练的。这使它能够学习各种角色的动作、控制和行动,并以一致的方式进行学习。因此,”我们的模型可以将任何...