金融界2024年3月16日消息,据国家知识产权局公告,中国工商银行股份有限公司申请一项名为“文本音素标注信息生成方法、装置和计算机设备“,公开号CN117711373A,申请日期为2023年12月。
专利摘要显示,本申请涉及一种文本音素标注信息生成方法、装置和计算机设备,涉及计算机领域。可用于金融科技领域或其他相关领域。所述方法包括:对语音文本进行分词,得到语音文本对应的分词结果;按照预设的韵律分析规则,根据分词结果对应的语法信息,确定语音文本对应的韵律边界信息;获取语音文本对应的注音信息,根据韵律边界信息和注音信息,确定语音文本对应的音素标注信息。采用本方法能够通过分析语音文本的韵律特征,结合语音文本的上下文韵律,对语音文本中的各音素进行准确的标注,得到用于生成对应的语音的音素标注信息,从而基于音素标注信息,生成能够体现语音文本上下文韵律特征的语音,进而提高语音合成的自然度。
来源:金融界