金融界2024年3月16日消息,据国家知识产权局公告,中国工商银行股份有限公司申请一项名为“语音生成方法、装置、计算机设备和存储介质“,公开号CN117711375A,申请日期为2023年12月。
专利摘要显示,本申请涉及一种语音生成方法、装置、计算机设备和存储介质,涉及计算机技术领域。可用于金融科技领域或其他相关领域。所述方法包括:从预设的语音数据库中查找语音文本对应的音节标记数据;根据语音文本,确定语音文本的韵律参数信息;根据韵律参数信息和音节标记数据,对语音文本的语音波形数据进行修改,得到音节标记数据对应的待合成波形数据;根据待合成波形数据,生成语音文本对应的目标语音。采用本方法能够通过分析语音文本的上下文语义,确定语音文本的韵律参数,结合语音文本在语音数据库中的音节标记数据,修改语音文本各语音段对应的语音波形,得到具有与语音文本的上下文语义相匹配的韵律特征的目标语音,提高合成的语音的自然度。
来源:金融界