发布时间:2025-01-26 10:24 已有: 人阅读
国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“基于大语言模型的音频生成方法装置”的专利,公开号CN 119339706 A,申请日期为2024年8月。 专利摘要显示,本公开提供一种基于大语言模型的音频生成方法,涉及大语言模型、自然语言处理、深度学习、音频生成等人工智能技术领域。基于大语言模型的音频生成方法包括:获取待处理文本;使用大语言模型解析所述待处理文本,得到对应所述待处理文本的角色信息与情感信息;根据所述角色信息与所述情感信息,得到目标参考文本与目标参考音频;根据所述待处理文本、所述目标参考文本与所述目标参考音频,生成对应所述待处理文本的目标音频。本公开能够提升所得到的角色信息与情感信息的准确性,使得所生成的目标音频与待处理文本所对应的角色以及该角色的情感更加匹配,从而提升目标音频的准确性、增强目标音频的真实性。 天眼查资料显示,北京百度网讯科技有限公司,成立于2001年,位于北京市,是一家以从事互联网和相关服务为主的企业。企业注册资本1342128万人民币,实缴资本1342128万人民币。通过天眼查大数据分析,北京百度网讯科技有限公司共对外投资了74家企业,参与招投标项目2822次,知识产权方面有商标信息974条,专利信息5000条,此外企业还拥有行政许可47个。 |