平安科技申请语音合成专利,提高语音生成稳定性

发布时间:2025-02-04 10:22 已有: 人阅读

  国家知识产权局信息显示,平安科技有限公司申请一项名为“语音合成方法装置设备及介质”的专利,公开号 CN 119380688 A,申请日期为 2024 年 11 月。

   专利摘要显示,本发明涉及人工智能技术领域,公开了一种语音合成方法、装置、设备及介质,包括:获取待合成文本和参考音频;采用滑动窗口算法将待合成文本划分为多个文本段;基于参考音频和预训练的语音合成模型,生成每个文本段对应的音频波形;对每个文本段对应的音频波形进行语音合成,得到目标语音。通过上述方式,采用滑动窗口算法对输入文本进行分割,形成若干段更小、更易管理的文本段,将若干个文本段和参数音频输入语音合成模型,使得语音合成模型基于较短的文本段逐句生成音频,使得模型能够更加专注于每个片段的精确语音和语调细节,确保音频输出的准确性和自然流畅性,解决了由于文本长度超出典型长度参数引起的退化问题,提高语音生成的稳定性。

   天眼查资料显示,平安科技有限公司,成立于2008年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本531031.58万人民币,实缴资本531031.58万人民币。通过天眼查大数据分析,平安科技有限公司共对外投资了4家企业,参与招投标项目276次,知识产权方面有商标信息75条,专利信息5000条,此外企业还拥有行政许可19个。

热门推荐
  • 微软推出Windows Terminal 1.0开源 微软推出Windows Terminal 1.0开源 Windows Terminal是一个开源的、基于选项卡UI风格的终端应用程序,最初发布于微软的Build 2019活动。所谓基于选项卡的UI,就是你可以在一个选项卡中打……[详细]
图文推荐
  • 苹果将??于本月晚些时候推出首款采用Mini-LE
  • iPad 2021,我们所知道的一切
  • 尽管Mini-LED面板供应受限,本月仍将推出新的