可灵大模型

可灵大模型介绍

可灵大模型(Kling)是由快手大模型团队自研打造的视频生成大模型,基于快手在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。可灵大模型具备强大的视频生成能力,生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。目前官网发布了移动端、Web端体验服务。

可灵大模型功能介绍

文生视频

1、大幅度的合理运动

可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。

2、长达2分钟的视频生成

得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。

3、模拟物理世界特性

基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。

4、强大的概念组合能力

基于对文本-视频语义的深刻理解和Diffusion Transformer架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的的场景。

5、电影级的画面生成

基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现。

6、支持自由的输出视频宽高比

可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。

图生视频

可灵图生视频以卓越的图像理解能力为基础,将静态图像转化为生动的5秒精彩视频。配上创作者不同的文本输入,即生成多种多样的运动效果,让您的视觉创意无限延展。

视频续写

可灵视频续写功能支持对已经生成的视频进行一键续写,单次让视频运动延续4.5秒,运动内容合理、幅度显著,最长可生成3分钟的视频。