七牛云智能剪辑解决方案,支持对海量音视频素材进行结构化分析,应用“人脸检测与识别、声纹比对、表情识别、镜头类型”等算法能力,通过音画一致性对比实现智能剪辑的功能,并支持导入主流剪辑软件进行二次精剪。
方案功能
1、声纹识别
提取说话人声音特征用于身份核验,通过声纹模型提取到各路音频的声音信息,在声纹库中进行搜索比对,实现在音频文件中对嘉宾身份的定位。
2、人脸识别/检测
基于先进的面部分析技术,实现了人脸检测、特征提取和搜索等功能,准确识别视频素材中对应画面的嘉宾人脸信息。
3、景别区分
基于画面中人脸和画面大小占比,人头数量等统计信息确定镜头的类型。
4、GPU虚拟化
自研分布式AI服务、应用GPU虚拟化技术实现多实例并行计算、按需调度,支持横向扩展,最大化发挥软硬件性能。
5、XML导出
基于时间维度,输出对素材分析的声纹、人脸、镜头等结构化信息,实现音画同步的剪辑功能,生成PR兼容的XML文件。
6、切镜毛刺去除
针对频繁镜头切换场景,针对性优化剪辑切换逻辑,应用“切镜毛刺去除算法”,使镜头切换更加平滑,进一步提升视觉体验。
方案架构
方案优势
1、低门槛
支持公有云/私有云、纯软/软硬一体等产品交付形态,大幅降低视频剪辑门槛。
2、自动化
从素材准备到自动合板,再到自动化剪辑,全程无需人工干预,助力预剪辑业务。
3、高效率
从录制结束到开始创作,周期由4-5天大幅缩短至6小时以内,节约时间成本。
4、算法领先
自研分布式AI服务、应用GPU虚拟化技术实现多实例并行计算、按需调度,具备业内领先的人脸识别、声纹对比、景别识别等AI能力。