可灵

快手AI团队自研的视频生成大模型

可灵（Kling）是由快手AI团队自研的视频生成大模型，通过人工智能技术生成高质量、高分辨率的视频内容，支持多种视频生成与应用场景。2024年6月6日在官网正式上线。

该模型集成3D时空联合注意力机制，擅长捕捉并模拟复杂运动，生成高真实感视频。搭载自研3D VAE技术，模型输出1080p、30fps的流畅视频。应用涵盖影视、社交、广告及电商领域。

发展历史

2024年6月6日，可灵大模型正式发布，并在快影App中向用户开放了邀测体验；6月21日，可灵大模型宣布新增图生视频功能；7月24日，可灵大模型完成了基础模型的升级，全面开放内测，并上线了会员体系。

2024年9月，快手宣布正式启动”可灵AI“电影共创计划，联合9位导演共同推出9部AIGC电影短片。9部短片全部由可灵AI进行视频生成，电影导演完全依托视频生成大模型，群体深度参与电影级内容创作，这在中国尚属首次1。

产品功能

可灵大模型具备生成长视频、多宽高比视频的能力，可生成长达2分钟、分辨率1080p、帧率30fps的视频，并支持自由宽高比。此外，该模型支持图像生成视频功能，能将静态图像转换为5秒视频，并根据文本实现视觉叙事；提供视频续写功能，一键续写可将视频延长至约3分钟；还具备交互功能，允许用户通过文本指令控制视频对象动态。

应用领域

可灵大模型在影视制作领域可用于生成高质量视频，适用于专业视频制作和创意素材生成。在社交媒体领域，适用于个性化内容创作和互动视频的制作。在广告行业中，可帮助生成低成本且高质量的视频和直播内容，以及在电商领域提供AI试衣功能。

技术特点

可灵大模型采用3D时空联合注意力机制，擅长建模复杂时空运动，适用于快速移动物体、剧烈变化场景和复杂人物动作的视频生成。该模型基于Diffusion Transformer架构，融合时间空间信息，精准捕捉视频帧内局部特征及跨帧时间动态特征，可将用户想象力转化为具体画面，创造虚构场景。此外，利用自研3D VAE技术，可生成高分辨率电影级视频，呈现场景与细节特写。

参考资料

1
快手可灵AI启动中国首个AIGC导演共创计划36氪（引用日期 2024-09-09）