广州思正电子股份有限公司胡会英获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州思正电子股份有限公司申请的专利基于多模态融合的智能拾音与语音识别系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120954408B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511487235.2,技术领域涉及:G10L15/22;该发明授权基于多模态融合的智能拾音与语音识别系统是由胡会英设计研发完成,并于2025-10-17向国家知识产权局提交的专利申请。
本基于多模态融合的智能拾音与语音识别系统在说明书摘要公布了:本发明公开了基于多模态融合的智能拾音与语音识别系统,涉及人工智能与语音识别交叉技术领域。系统包括主控制模块、多个拾音节点和多模态融合引擎,其中多模态融合引擎包含声源定位与分离、环境自适应降噪、跨模态特征融合及动态上下文理解四个核心组件。通过阵列麦克风与辅助传感器组采集多模态数据,系统实现声源定位与分离、动态环境噪声抑制、多模态特征深度融合以及上下文语义校正。本发明有效提升语音识别的鲁棒性、准确率及智能交互能力,在噪声环境、口音变化等复杂场景下改善语音交互体验,为智能语音交互设备提供更可靠的语音处理解决方案。
本发明授权基于多模态融合的智能拾音与语音识别系统在权利要求书中公布了:1.基于多模态融合的智能拾音与语音识别系统,其特征在于,包括主控制模块、多个分布式部署的拾音节点、通信模块以及多模态融合引擎; 所述主控制模块,内部包含多模态数据协调器、识别结果融合器以及系统参数优化器,用于多模态数据的协同处理、识别结果的综合决策和系统参数的全局优化; 每个拾音节点包括阵列麦克风、辅助传感器组和本地预处理单元,所述阵列麦克风用于采集空间不同位置的语音信号以支持声源定位与波束形成,所述辅助传感器组包括红外传感器、振动传感器和环境噪声传感器,分别用于检测说话人位置与活动状态、采集固体传导声音、分析噪声特征,所述本地预处理单元用于对采集的原始信号进行放大、滤波、AD转换和压缩; 所述通信模块采用有线或无线通信技术,在拾音节点与主控制模块之间传输多模态数据和控制指令; 所述多模态融合引擎包括声源定位与分离引擎、环境自适应降噪引擎、跨模态特征融合引擎和动态上下文理解引擎,用于对多模态信息进行深度融合以提升语音识别的鲁棒性和准确率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州思正电子股份有限公司,其通讯地址为:510000 广东省广州市黄埔区香山路17号厂房B栋203房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励