福建三青鸟科技有限公司何丽丽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉福建三青鸟科技有限公司申请的专利一种多模态语音识别纠错方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121354572B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511913600.1,技术领域涉及:G10L15/26;该发明授权一种多模态语音识别纠错方法和系统是由何丽丽设计研发完成,并于2025-12-18向国家知识产权局提交的专利申请。
本一种多模态语音识别纠错方法和系统在说明书摘要公布了:本发明公开了一种多模态语音识别纠错方法和系统,涉及语音识别技术领域,其技术方案要点包括以下步骤:根据待纠错的目标语音转写文本以及对应的多模态关联数据,得到目标语音转写文本在标准场景与适配画像场景的第一纠错值;若历史多模态关联数据中不同数据维度特征呈非适配变动状况,提取非适配变动状态影响识别偏差的第一关联影响系数;若历史多模态关联数据中不同数据维度特征呈适配稳定情况,提取跨维度信息适配转换影响识别偏差的第二关联影响系数,提取同维度内部特征适配转换影响识别偏差的第三关联影响系数;效果是得到更贴合实际语音表意的正确识别结果。
本发明授权一种多模态语音识别纠错方法和系统在权利要求书中公布了:1.一种多模态语音识别纠错方法,其特征在于,该方法包括以下步骤: 根据待纠错的目标语音转写文本以及对应的多模态关联数据,得到目标语音转写文本在标准场景与适配画像场景的第一纠错值,具体包括以下步骤: 对目标语音转写文本进行语义拆分处理得到文本核心表意要素与语义关联之间的语义结构;分离多模态关联数据中语音表达的发声特征、使用环境相关的环境特征以及使用者的个体特征构建多维度特征体系; 依据语义结构与多维度特征体系搭建标准场景校验基准,标准场景校验基准整合通用语言表达规范、常规环境的语音传递规律及语义逻辑准则,将语义结构与标准场景校验基准逐要素比对得到语义偏差项,确定语义偏差项的数量和影响程度后形成标准场景偏差信息; 依据多维度特征体系的个体特征、使用者语言表达习惯、特定场景的表达偏好以及常用语义组合方式构建适配画像场景校验基准,将语义结构与适配画像场景校验基准进行匹配后识别文本符合通用规范、并与使用者表达习惯相悖的适配偏差项,判断适配偏差项的修正必要性及关联影响范围后得到适配画像场景偏差信息; 基于标准场景偏差信息与适配画像场景偏差信息建立偏差权重分配规则,根据场景使用优先级及规范要求确定标准场景偏差信息与适配画像场景偏差信息的影响权重,按照权重分配规则对标准场景偏差信息与适配画像场景偏差信息进行融合处理得到反映场景适配性与语义准确性的第一纠错值; 若历史多模态关联数据中不同数据维度特征呈非适配变动状况,提取非适配变动状态影响识别偏差的第一关联影响系数; 若历史多模态关联数据中不同数据维度特征呈适配稳定情况,提取跨维度信息适配转换影响识别偏差的第二关联影响系数,提取同维度内部特征适配转换影响识别偏差的第三关联影响系数; 根据第一关联影响系数、第二关联影响系数、第三关联影响系数判断目标语音转写文本在数据适配状态和维度转换影响的偏差程度得到第二纠错值; 从综合比对验证基准中筛选得到进行目标语音转写文本纠错验证的目标比对验证基准,将目标比对验证基准、第一纠错值和第二纠错值进行处理得到实际纠错值一和实际纠错值二,根据实际纠错值一或实际纠错值二对目标语音转写文本进行纠错处理得到正确识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福建三青鸟科技有限公司,其通讯地址为:350108 福建省福州市闽侯县上街镇科技东路11号网讯智慧中心B楼24层B36;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励