- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
图片简介:
本技术介绍了一种识别方言种类的方法和装置。其中,该方法包括:获取待检测音节序列中每个音节的第一声学特征和第二
声学特征;将每个音节的第一声学特征输入到训练好的发音类型模型得到每个音节的发音类型;将发音类型输入到训练好的
发音类型组合模型得到第一概率;将每个音节的第二声学特征输入到训练好的声调模型得到第二概率;根据第一概率和第二
概率的乘积确定音节序列所属的方言种类。本技术解决了现有技术的方言辨识方法存在的准确率较低且不具有普遍适用性的
技术问题。
技术要求
1.
一种识别方言种类的方法,其特征在于,包括:
获取待检测音节序列中每个音节的第一声学特征和第二声学特征,其中,所述音节序列为至少一个音节所组成的序列;
将每个音节的第一声学特征输入到训练好的发音类型模型得到每个音节的发音类型,其中,所述发音类型模型是使用发音
类型和第一声学特征训练而成的,所述发音类型是在一个音节中不同音节片段的位置所对应的类型;
将所述发音类型输入到训练好的发音类型组合模型得到第一概率,其中,所述发音类型组合模型是使用所述发音类型、发
音类型的位置关系和待检测音节序列所属方言类型的概率训练而成的,所述第一概率是待检测的音节序列所属方言类型出
现的概率,所述发音类型的位置关系是每个发音类型在不同音节片段上的位置关系;
将每个音节的第二声学特征输入到训练好的声调模型得到第二概率,其中,所述声调模型是使用第二声学特征和其对应声
调所属的方言种类的概率训练而成的,所述第二概率是所述音节序列中的声调所属的方言种类的概率;
根据所述第一概率和所述第二概率的乘积确定所述音节序列所属的方言种类。
2.1
根据权利要求所述的方法,其特征在于,根据所述第一概率和所述第二概率的乘积确定所述音节序列所属的方言种类
包括:
计算所述第一概率和所述第二概率的乘积得到所述音节序列所属的方言种类的概率,其中,所述方言种类的概率是所述音
节序列在属于多个不同的方言种类的概率;
将所述方言种类的概率由高到底进行优先级排序;
将在优先级排序结果中大于等于阈值概率的方言种类作为候选方言种类,其中,所述候选方言种类为至少一个;
对每一个所述候选方言种类重新进行其方言种类的识别过程直至所述候选方言种类为一种。
3.2
根据权利要求所述的方法,其特征在于,对每一个所述候选方言种类重新进行方言种类的识别过程直至所述候选方言
种类为一种包括:
判断待验证音节序列在候选方言中的显著程度;
选取显著程度高的待验证音节序列进行候选方言种类识别过程,其中,所述待验证音节序列与所述音节序列不同。
4.1
根据权利要求所述的方法,其特征在于,所述发音类型模型是使用发音类型和第一声学特征结合高斯混合模型训练而
成的,其中,所述第一声学特征为梅尔倒谱特征。
5.1
根据权利要求所述的方法,其特征在于,所述发音类型组合模型是使用所述发音类型、发音类型的位置关系和待检测
音节序列所属方言类型的概率通过三层神经网络学习训练而成的。
6.1
根据权利要求所述的方法,其特征在于,所述声调模型是使用第二声学特征和其对应声调所属的方言种类的概率结合
高斯混合模型训练而成的,其中,所述第二声学特征是基频轮廓特征、时长特征和能量特征。
7.1
根据权利要求所述的方法,其特征在于,所述音节片段是将每个音节根据声母、韵母划分成的三个音节片段;所述第
一音节片段位置对应的发音类型是塞音、擦音、塞擦音、鼻音和边音;所述第二音节片段位置对应的发音类型是开口呼、
齐齿呼、合口呼和撮口呼;所述第三音节片段位置对应的发音类型是塞音、擦音和鼻音。
8.
一种识别方言种类的装置,其特征在于,包括:
获取模块,用于获取待检测音节序列中每个音节的第一声学特征和第二声学特征,其中,所述音节序列为至少一个音节所
组成的序列;
第一识别模块,用于将每个音节的第一声学特征输入到训练好的发音类型模型得到每个音节的发音类型,其中,所述发音
类型模型是使用发音类型和第一声学特征训练而成的,所述发音类型是在一个音节中不同音节片段的位置所对应的类型;
第二识别模块,用于将所述发音类型输入到训练好的发音类型组合模型得到第一概率,其中,所述发音类型组合模型是使
用所述发音类型、发音类型的位置关系和待检测音节序列所属方言类型的概率训练而成的,所述第一概率是待检测的音节
序列所属方言类型出现的概率,所述发音类型的位置关系是每个发音类型在不同音节片段上的位置关系;
第三识别模块,用于将每个音节的第二声学特征输
文档评论(0)