在大家震惊Sora生成视频逼真之余,谷歌紧随其后推出了更为惊人的全新AI基础世界模型——Genie。Genie是一个生成式交互环境,由时空视频分词器、自回归动力学模型和简单且可扩展的潜在动作模型组成,拥有110亿个参数。
与以往只关注世界生成的模型不同,Genie允许用户与创建的环境进行交互,通过文本、合成图像、照片甚至草图生成可玩的交互式环境和可控虚拟世界。这代表了生成式人工智能的重大进步,为人工智能在虚拟世界中展现出无限可能性。
OpenAI和谷歌在AI领域的竞争激烈,Sora和Genie都致力于从视觉模型的角度模拟物理世界,实现通用人工智能。有趣的是,它们都采用了Visual Transformer模型,但训练数据的选择不同。
Sora采用了分布式训练,将训练任务拆分成多个子任务并在多个节点上并行执行,以提高训练速度。同时,Sora还采用了数据并行和模型并行的策略,使训练更高效。
Genie则在大量公开的互联网视频数据集上进行了无动作标签的训练,可以将任何图像转换为简单的2D平台游戏。最独特的地方在于,Genie可以通过无监督学习理解游戏世界中角色的移动、控制和行动,并根据用户操作预测未来帧,创造出功能性和可玩性的体验。简而言之,Genie具备了“自学成才”的能力。
Genie的问世证明了通过AI构建虚拟世界已经非常接近,AI通过视频的自我训练可以学习到真实世界的物理规则,为AI在虚拟世界中的应用带来了更多可能性。这一进展将对虚拟环境的发展和应用产生深远影响,推动人工智能技术在游戏开发等领域的应用和创新。
尽管AI在生成游戏方面取得了显著进展,但目前仍需要人类的辅助。虽然AI能够理解并生成游戏的基本框架和规则,但深度的游戏设计、角色设定和剧情构建等方面仍需要人类的创造力和策划能力。人类设计师可以根据市场需求和玩家偏好,制定详细的游戏设计方案,并为AI提供明确的指导和限制。
在游戏开发完成后,大量的测试和调试工作是必不可少的,以确保游戏在各种情况下的稳定性和可玩性。这部分工作同样需要人类的介入,因为AI可能无法覆盖所有测试场景和异常情况。
AI在游戏开发领域有着广泛的应用前景。人类与AI的协作将成为未来游戏开发的重要趋势,通过结合人类的创造力和AI的计算能力,可以实现更加创新和优质的游戏体验。