Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华南理工大学贺前华获国家专利权

华南理工大学贺前华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华南理工大学申请的专利基于无监督学习和迁移学习的低资源语音关键词检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116434742B

龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310310453.3,技术领域涉及:G10L15/06;该发明授权基于无监督学习和迁移学习的低资源语音关键词检测方法是由贺前华;郑若伟;徐剑斌;李学高设计研发完成,并于2023-03-28向国家知识产权局提交的专利申请。

基于无监督学习和迁移学习的低资源语音关键词检测方法在说明书摘要公布了:本发明公开了基于无监督学习和迁移学习的低资源语音关键词检测方法:使用无标注语音数据进行训练得到无监督网络模型;冻结该模型参数作为特征提取网络,与预编码层和决策网络一同构建语音关键词检测模型;在富资源条件下进行有监督预训练得到富资源语音关键词检测模型;在低资源条件下,将已训练完成的富资源语音关键词检测模型的参数迁移至当前模型,进而微调得到低资源语音关键词检测模型;最后根据模型输出进行解码判断样本是否包含预定关键词。本发明结合了无监督学习和迁移学习,充分利用了无标注数据和有标注数据,提高了在低资源条件下语音关键词检测性能,改善语音关键词检测领域数据不足的情况。

本发明授权基于无监督学习和迁移学习的低资源语音关键词检测方法在权利要求书中公布了:1.基于无监督学习和迁移学习的低资源语音关键词检测方法,其特征在于包括如下步骤: S1、使用无标注语音数据集中语音样本Xn的原始波形,直接输入无监督网络模型M1进行训练; 其中,N1为无标注语音样本总数; S2、复用网络模型M1的作为特征提取网络,使用预编码层将其与决策网络相连,构建语音关键词检测模型M2; S3、使用带标注的富资源语音数据集训练M2中的预编码层和决策网络,得到语音关键词检测模型M2; 其中,Yn为语音样本Xn对应的标注文本,N2为富资源语音样本总数; S4、将富资源语音关键词检测模型M2迁移至低资源语音关键词检测模型M3,然后使用带标注的低资源语音数据集微调训练模型M3; 其中,N3为低资源语音样本总数; S5、将低资源语音样本输入语音关键词检测模型M3,得到后验概率输出矩阵,利用前缀束搜索算法进行解码,判断解码结果中是否包含的预定义关键词; 步骤S1中的无监督网络模型,由编码器和上下文表示模块组成; 编码器由多个一维卷积神经网络层构成,用于将输入语音序列编码为潜在的发音表示; 上下文表示模块由多个包含多头注意力机制的Transformer层构成,用于从潜在的发音表示构建上下文表示,即语音的高维深度特征; 步骤S2中的语音关键词检测模型中的预编码层具体包括一个全连接层和激活函数,用于对高维深度特征进行降维: O=fWTI+b; 其中,I表示经过特征提取网络所得到的高维特征矩阵,O表示降维后的低维特征矩阵,W为全连接层可学习的权重参数矩阵,b为对应的偏置,线性整流函数fx=max0,x作为激活函数进行非线性变换; 步骤S2中的语音关键词检测模型中的决策网络为卷积循环神经网络,具体包含卷积神经网络模块、循环神经网络模块和全连接网络模块,最后一个全连接层的输出维度与对应语音关键词的目标标签类别数一致; 步骤S4中的低资源语音关键词检测模型M3的有监督微调训练,具体过程如下: S4.1:迁移模型M2的预编码层和决策网络的参数至模型M3; S4.2:将模型M3的最后一个全连接层替换为与目标输出维度匹配的全连接层,并随机初始化参数; S4.3:模型M3的特征提取网络保持冻结,将带标注的低资源语音数据集D3直接输入模型M3,采用步骤S3训练方式进行参数微调。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。