论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 97阅读
  • 0回复

[业界新闻]OpenAI的Sora视频生成模型也能用来渲染视频游戏 [复制链接]

上一主题 下一主题
 

发帖
6194
今日发帖
最后登录
2024-09-20
只看楼主 倒序阅读 使用道具 楼主  发表于: 2024-02-18 14:44:48
  OpenAI新推出的首个视频生成模型-视频生成模型索拉(Sora)可以完成一些真正令人印象深刻的影片生成壮举。不过,至少从今天晚上发表的一篇技术论文来看,这个模型比OpenAI最初想象的还要厉害。 XKLF8~y8A  
I>w^2 (y  
  这篇题为《作为世界模拟器的视频生成模型》(Video generation models as world simulators)的论文由多位OpenAI研究人员共同撰写,揭开了Sora架构关键方面的神秘面纱--例如,Sora可以生成任意分辨率和长宽比(最高1080p)的视频。根据论文所述,Sora能够执行一系列图像和视频编辑任务,从创建循环视频、向前或向后延伸视频到更改现有视频的背景。 WO%h"'iJ  
W$\X~Q'0  
  但最吸引笔者的还是Sora"模拟数字世界"的能力,OpenAI的合著者如是说。在一次实验中,OpenAI将Sora放到Minecraft上,让它在控制玩家的同时渲染世界及其动态(包括物理)。 VTh$a_P>  
#7z|mVzH  
  Sora在Minecraft中控制一名玩家,并渲染视频游戏世界,请注意,颗粒感是由视频到GIF的转换工具造成的,而不是Sora。图片来源:OpenAIOpenAI ~-Oa8ww  
fCEz-TMW  
  那么,Sora是如何做到这一点的呢?正如NVIDIA高级研究员Jim Fan(通过Quartz)所说,与其说Sora是一个创意引擎,不如说它是一个"数据驱动的物理引擎"。它不仅能生成单张照片或视频,还能确定环境中每个物体的物理特性,并根据这些计算结果渲染照片或视频(或交互式3D世界,视情况而定)。 )bWrd $X  
.`LgYW  
  合著者写道:"这些功能表明,继续扩展视频模型是开发物理和数字世界以及其中的物体、动物和人的高能力模拟器的一条大有可为的途径。" -2NwF4VL  
T+TF-] J  
  现在,Sora在视频游戏领域也有其通常的局限性。该模型无法准确模拟玻璃碎裂等基本互动的物理过程。即使在可以建模的互动中,Sora也经常出现不一致的情况,例如在渲染一个人吃汉堡时,却无法渲染汉堡上的咬痕。 g_D-(J`IK,  
3;BvnD7  
  不过,如果我没看错的话,Sora似乎可以为更逼真(甚至可能是逼真)的程序生成游戏铺平道路。这既令人兴奋,又令人恐惧(考虑到Deepfake的影响)--这也许就是为什么OpenAI选择暂时将Sora关在一个非常有限的访问程序后面的原因。 l`rC0kJ]