• 1.摘要
  • 2.基本信息
  • 3.产品简介
  • 4.产品功能
  • 5.产品优势
  • 6.应用场景
  • 7.合作案例
  • 8.参考资料

搜狗声咖

搜狗声咖1是一个一站式音视频智能创作平台,提供文本配音、音频变声、音频工具箱(声伴分离)等功能,能满足新闻播报、文章播报、视频制作、有声小说、语音助手等使用场景的音视频创作需求。

基本信息

  • 中文名称

    搜狗声咖

  • 开发公司

    北京搜狗科技发展有限公司

  • 开发团队

    搜狗知音

  • 软件官网

    https://shengka.ai.sogou.com/

产品简介

基于AI交互团队自研的style tts语音合成技术、语音变声技术,用户只需导入文本或上传已录制的音频,选择音色,即可生成高品质的音频内容,解决用户音视频创作过程中的难点难题,帮助用户们“更快捷更高效地创作高品质音视频内容”。

产品功能

目前,声咖有三大功能板块:文本配音、音频变声、工具箱(声伴分离)。

1.文本配音:将文本一键生成富有表现力的语音音频,千字内容只需5秒,适用于新闻播报、文章播报、视频配音、有声小说、语音助手等场景。                                              

2.音频变声:将任意音频音色转化为平台提供的音色,完整保留原音频的语气语调、抑扬顿挫及表达风格,提升作品的情绪感染力。

3.工具箱:包括声伴分离等音视频处理功能。声伴分离,能够从任意音/视频中分离出伴奏及人声,为视频制作、有声内容生产提供素材。1

产品优势

1.丰富发音人选择

文本配音板块,提供几十种自有版权的发音人,包括磁性、亲切、幽默、甜美、多语种等类型,能够满足各类音视频制作风格的需求。此外,多名发音人具备“单人千面”能力,能够切换陕西、东北、湖北等多种方言类型和开心、愤怒、恐惧等多种情感。

2.可视化读法纠正

文本配音板块,采用word编辑器模式,提供【插入停顿】、【局部变速】、【词组连读】、【多音字】修改、【数字符号】、【单词读法】、【发音替换】、【多发音人】等多种读法编辑功能,通过将读法可视化,更便捷、准确的生成音频文件。

3.单句灵活调整

音频变声板块,支持对单句内容进行删减、替换等修改,降低用户音频修改成本。1

应用场景