可灵
可灵(Kling)是由快手AI团队自研的视频生成大模型,通过人工智能技术生成高质量、高分辨率的视频内容,支持多种视频生成与应用场景。2024年6月6日在官网正式上线。
该模型集成3D时空联合注意力机制,擅长捕捉并模拟复杂运动,生成高真实感视频。搭载自研3D VAE技术,模型输出1080p、30fps的流畅视频。应用涵盖影视、社交、广告及电商领域。
发展历史
2024年6月6日,可灵大模型正式发布,并在快影App中向用户开放了邀测体验;6月21日,可灵大模型宣布新增图生视频功能;7月24日,可灵大模型完成了基础模型的升级,全面开放内测,并上线了会员体系。
2024年9月,快手宣布正式启动”可灵AI“电影共创计划,联合9位导演共同推出9部AIGC电影短片。9部短片全部由可灵AI进行视频生成,电影导演完全依托视频生成大模型,群体深度参与电影级内容创作,这在中国尚属首次1。
产品功能
可灵大模型具备生成长视频、多宽高比视频的能力,可生成长达2分钟、分辨率1080p、帧率30fps的视频,并支持自由宽高比。此外,该模型支持图像生成视频功能,能将静态图像转换为5秒视频,并根据文本实现视觉叙事;提供视频续写功能,一键续写可将视频延长至约3分钟;还具备交互功能,允许用户通过文本指令控制视频对象动态。
应用领域
可灵大模型在影视制作领域可用于生成高质量视频,适用于专业视频制作和创意素材生成。在社交媒体领域,适用于个性化内容创作和互动视频的制作。在广告行业中,可帮助生成低成本且高质量的视频和直播内容,以及在电商领域提供AI试衣功能。
技术特点
可灵大模型采用3D时空联合注意力机制,擅长建模复杂时空运动,适用于快速移动物体、剧烈变化场景和复杂人物动作的视频生成。该模型基于Diffusion Transformer架构,融合时间空间信息,精准捕捉视频帧内局部特征及跨帧时间动态特征,可将用户想象力转化为具体画面,创造虚构场景。此外,利用自研3D VAE技术,可生成高分辨率电影级视频,呈现场景与细节特写。
参考资料
- 1快手可灵AI启动中国首个AIGC导演共创计划36氪(引用日期 2024-09-09)