OpenAI去年凭借ChatGPT的流行而进入主流,现在该公司正将其人工智能技术应用到视频行业。
OpenAI于周四推出了其新的生成式AI模型Sora。Sora的工作方式类似OpenAI的图像生成AI工具DALL-E。用户输入所需场景,Sora将返回一个高清视频片段。Sora还可以生成受静态图像启发的视频片段,或扩展现有视频或填充缺失帧。
Sora是一个扩散式人工智能模型,与ChatGPT一样,它使用谷歌研究人员在2017年论文中提出的Transformer架构。OpenAI在其声明中写道:“Sora为能够理解和模拟现实世界的模型奠定了基础。”
Sora目前只能生成一分钟或更短的视频。作为微软支持的OpenAI,其发展目标之一是多模态——将文本、图像和视频生成结合起来,从而提供更广阔的人工智能模型套件。
目前,Sora只提供给一小部分安全测试人员 (又称“红队”) 使用,他们负责测试模型在错误信息和偏见等方面的漏洞。该公司表示,其配套的技术论文将在周四晚些时候发布。
OpenAI还表示,他们正在构建一个可以识别由Sora生成的视频的“检测分类器”,并计划在其输出中包含某些元数据,以帮助识别人工智能生成的内容。这与Meta在今年大选期间用来识别人工智能生成图像的元数据类型相同。
现在聊天机器人和图像生成器已经进入消费和商业世界,视频可能是生成式AI的下一个前沿。
借助Sora,OpenAI正在寻求与Meta和谷歌等公司的视频生成AI工具竞争,后者于 1月宣布了Lumiere。其他初创公司也提供了类似的人工智能工具,例如Stability AI,其产品名为Stable Video Diffusion。亚马逊还发布了Create with Alexa,这是一个专门生成基于提示的短格式动画儿童内容的模型。
OpenAI官网发布的Sora生成视频:
Tokyo in the snow
Gold Rush
Ships in coffee
Big Sur
暂无评论内容