中国科学院苏州生物医学工程技术研究所郭凯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院苏州生物医学工程技术研究所申请的专利一种基于人类嘴部运动的语言识别方法以及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119964572B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411971622.9,技术领域涉及:G10L15/25;该发明授权一种基于人类嘴部运动的语言识别方法以及装置是由郭凯;吴煜雯;马哈茂德·艾尔萨曼缇;罗先佰;许方鸣;李广泽;王杰;张宇泽设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种基于人类嘴部运动的语言识别方法以及装置在说明书摘要公布了:本发明公开了一种基于人类嘴部运动的语言识别方法以及装置,属于语言识别领域,通过采集用户嘴部运动过程中的面部和颈部的肌肉活动的电信号以及嘴部运动过程中面部图像;对肌电信号以及面部图像进行特征提取,将肌电信号特征与面部运动特征进行多模态融合,构建联合特征向量,捕捉静默语音的肌肉活动与口部动作之间的内在关联;基于Transformer网络构建多模态静默语音识别模型,识别对应的语音内容;基于NLP的模糊语言处理,生成完整的句子输出,通过上述步骤,本发明基于人类嘴部运动的语言识别方法能够识别静默方式表达的语音,避免环境干扰,有利于发音障碍人群使用,有利于通信的保密性。
本发明授权一种基于人类嘴部运动的语言识别方法以及装置在权利要求书中公布了:1.一种基于人类嘴部运动的语言识别方法,其特征在于,包括以下步骤: 数据采集:采集用户嘴部运动过程中的面部和颈部的肌肉活动的电信号以及嘴部运动过程中面部图像; 图像特征提取:采用面部关键点检测算法对面部图像进行精准定位嘴部和下颌区域并提取感兴趣区域,使用卷积神经网络提取单帧图像的嘴部几何特征,使用时序模型捕捉嘴部在时间维度上的运动特征,结合光流法分析连续帧间的运动轨迹,获取相关特征,利用时间序列分析动态变化特征; 特征融合:将肌电信号特征与面部运动特征进行多模态融合,构建联合特征向量,捕捉静默语音的肌肉活动与口部动作之间的内在关联; 基于Transformer网络构建多模态静默语音识别模型:构建基于Transformer网络的多模态静默语音识别模型,对来自多源输入的联合特征向量进行深度分析和分类,识别对应的语音内容; 基于NLP的模糊语言处理:对识别的语音内容进行文本错误检测与候选生成,针对检测到的错误候选词,设计基于模糊匹配的纠正算法,生成多个可能的候选修正方案,在候选纠正过程中,采用依存句法分析以及语义嵌入对比方法生成完整的句子输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院苏州生物医学工程技术研究所,其通讯地址为:215163 江苏省苏州市高新区科技城科灵路88号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励