科大讯飞股份有限公司熊世富获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司申请的专利关键词识别方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120930643B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511453759.X,技术领域涉及:G06F40/284;该发明授权关键词识别方法、装置、电子设备及存储介质是由熊世富;程实;申凯;周恒顺;万根顺;高建清设计研发完成,并于2025-10-13向国家知识产权局提交的专利申请。
本关键词识别方法、装置、电子设备及存储介质在说明书摘要公布了:本发明提供一种关键词识别方法、装置、电子设备及存储介质,属于人工智能技术领域,包括:基于至少一个注册模态特征和至少一个查询模态特征确定可用模态对集合,可用模态对集合中的模态对是遍历任一查询模态特征与任一注册模态特征的组合;获取每个模态对的隐藏状态向量,聚合所有隐藏状态向量生成聚合特征向量以用于确定识别结果。本发明通过构建一个能够根据实际可用的注册与查询模态组合,动态地确定模态对并聚合其对应特征的识别框架,解决了在模态缺失场景下性能急剧退化或失效的问题,实现了对不同模态输入的灵活兼容与自适应融合,显著增强了关键词识别系统在复杂、多变的真实应用场景下的泛化能力、鲁棒性与实用性。
本发明授权关键词识别方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种关键词识别方法,其特征在于,包括: 基于预设的至少一个注册模态下获取的注册模态特征,以及至少一个查询模态下获取的查询模态特征,确定可用模态对集合;所述可用模态对集合中的模态对是遍历任一所述查询模态特征与任一所述注册模态特征的组合; 获取所述可用模态对集合中的每个模态对所对应的隐藏状态向量; 聚合所有所述隐藏状态向量,生成聚合特征向量; 基于所述聚合特征向量,确定识别结果;所述识别结果用于表征任一查询模态特征所对应的查询输入中是否包含预设关键词的识别结果; 所述关键词识别方法,还包括: 采集训练样本集,所述训练样本集包括多组训练样本,每组训练样本至少包括一个注册模态下的注册输入样本、至少一个查询模态的查询输入样本,以及预先标注的识别结果标签和干净音频信号标签; 利用所述训练样本集迭代执行对一待训练关键词识别模型的训练过程,直至满足第二预设截止条件; 其中,在每一次训练过程中从所述训练样本集中随机选取一个批次的训练样本,执行以下训练步骤直至遍历所述批次内的所有训练样本: 将从所述批次中选取的一组训练样本作为所述待训练关键词识别模型的输入,获取所述待训练关键词识别模型输出的预测识别结果以及过程中所产生的降噪语音训练信号和帧级音视频融合向量序列; 计算所述预测识别结果与所述训练样本的识别结果标签之间的判决损失; 计算所述降噪语音训练信号与所述训练样本的干净音频信号标签之间的降噪损失; 将所述帧级音视频融合向量序列映射至所述训练样本中的文本音素特征所在的特征空间后,执行基于时间窗中心的类高斯分布的加权处理,生成音素级的融合特征表示,以计算所述融合特征表示与所述文本音素特征之间的空间对齐损失; 基于所述判决损失、所述降噪损失和所述空间对齐损失,更新所述待训练关键词识别模型的参数; 所述待训练关键词识别模型至少包括特征编码器、掩码生成网络、循环神经网络和分类器网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新开发区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励