OpenAI宣布所有用户无限用Sora

近日,OpenAI在第13天的直播中宣布将在假期期间为所有用户无限制的提供文生视频模型Sora,轻松跳过烦人的队列等待。

Sora

对于很多用户来说,在圣诞节能够获得这样的圣诞礼物,是一件非常不错的事。

应用Patch是Sora的核心技术之一,允许在大量的图像和视频数据上进行密集训练。从每一个存在的视频中剪出的Patch,可以被堆叠起来并输入到模型中。这种基于Patch而非视频全帧的训练方式,使得Sora能够处理任何大小的视频或图片,无需进行裁剪。这不仅增加了用于训练的数据量,也提高了输出质量。

同时,Sora还采用了视频压缩网络,这是为了进一步提升效率和效果。Sora是一种专门设计用来降低视觉数据维度的神经网络,原始视频通过该网络可以被转换成一个在时间和空间上都经过压缩的潜在表示。Sora在这个压缩后的潜在空间内接受训练,并学习如何生成新的视频内容。同时还训练了一个解码器模型,用于将生成的潜在表示映射回像素空间,恢复为可视化的视频帧。

对于时空潜伏斑块,在获取压缩输入视频后,OpenAI从中提取出一系列时空Patch作为转换标记。基于这种Patch表示法,Sora得以在各类视频和图像数据上进行训练,无论是不同分辨率、时长还是长宽比的素材都能轻松应对。在推理阶段,通过在适宜大小的网格中合理排列随机初始化的Patch,便能精准控制生成视频的尺寸规格。

由于一些规则原因,目前有些地区可能无法直接访问Sora。

行业动态

谷歌发布全新推理模型Gemini 2.0 Flash Thinking

2024-12-20 9:37:40

学堂

为什么要选择Gname企业邮箱?

2023-11-29 15:21:18

相关推荐