科技快讯

谷歌发布基础世界模型Genie 能一图创建互动的虚拟环境

2024年02月29日 | 查看: 68750

  据谷歌公司官网26日报道,谷歌旗下“深度思维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。

谷歌发布基础世界模型Genie 能一图创建互动的虚拟环境
图片来源于网络,如有侵权,请联系删除

Genie效果的动图截图演示。图片来源:谷歌官网

  过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式,即生成式交互式环境,通过单个图像提示即可生成交互式、动作可控的环境。

  Genie是一个110亿参数的基础世界模型,在超过20万小时的二维(2D)游戏视频上进行训练,无需人工监督。这意味着Genie可以从视频中自行识别不同动作的特征和模式。其能学习各种角色的动作、控制和行动。

  Genie的独特之处还在于它能够专门从互联网视频中学习细颗粒度的控制。Genie不仅能观察哪些部分是可控制的,而且能根据生成的环境来推测出多种潜在的动作。

  该模型接受单个图像(无论是AI合成图像、照片还是草图),并将其转换为可玩的游戏,响应用户控件。从图像到基本的交互环境一步到位。

  用户只需提供一张纸上的草图、一幅完美的数字艺术作品,甚至是AI生成对2D世界的描述,Genie就会完成剩下的工作,帮用户生成2D游戏。

  谷歌官网称,Genie专注2D平台游戏和机器人技术的视频,但方法通用,应适用于任何类型领域并可扩展至更大的互联网数据集。只需一张图像就能创建全新的交互环境,这为生成和进入虚拟世界的各种新路径开启了大门。(记者 张梦然)

【纠错】 【责任编辑:朱家齐】
    阅读下一篇:
      深度观察
      • 新华全媒头条丨解码中国航空工业集团发展新亮点
      • 全球连线丨塞中友谊结出实实在在的硕果
      • 新华全媒+丨“勺勺客”因何“搅香”世界
      • 乡村行·看振兴丨广东连山:“三地活化”让闲置地变“活资产”
      • 新华视点丨一边高溢价一边高报损 面包门店浪费现象调查
      • 秀我中国丨“子”的一天:商代年轻人这样学习和生活
      • 南方振兴|咖啡经济折射巴拿马农业精品化之路
      • 这个小镇,真有两把“刷子”!
      • 120背后的故事

              推荐阅读:

              人保车险|第三者责任险中“第三者”如何认定?

              人保车险|600余万新能源车主,终于等到你!

              祥菱V3掀起微卡跨界潮流 中国微卡颠覆者领潮上市

              推动机器人更好服务生活

              “AI+云计算”助技术红利长效释放——2023云栖大会观察

              技术创新提速汽车智能化

              人保服务|保护孩子,您可能需要一份意外险!

              推进人工智能与产业紧密融合

              工信部印发《关于健全中小企业公共服务体系的指导意见》

              搭载“蓝科技”全技术 vivo X100系列正式发布

              关键词: