南京邮电大学管振凯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种基于LSTM和NLP的手语识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116453224B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310437786.2,技术领域涉及:G06V40/20;该发明授权一种基于LSTM和NLP的手语识别方法及系统是由管振凯;戴华;李惠;陆雨欣;高慧婷;陈玉;陈燕俐;杨庚设计研发完成,并于2023-04-21向国家知识产权局提交的专利申请。
本一种基于LSTM和NLP的手语识别方法及系统在说明书摘要公布了:本发明属于手语识别技术领域,公开了一种基于LSTM和NLP的手语识别方法和系统,该方法包含模型训练和手语识别两个阶段,在模型训练阶段,利用手语词元数据集与姿态检测模型获取时序关键点序列样本,训练LSTM‑SL模型、利用手语常用语料库分词获得手语表征四元组,训练W2V‑SL模型;手语识别阶段包括将待识别的手语视频或实时手语画面通过LSTM‑SL转换为手语词元预测序列,并利用滑动窗口机制和W2V‑SL模型输出符合语言规范的手语语句,并在此方法上提出了手语识别系统。本发明简化了手语识别对时序特征的采集难度,有效增强了自然语句的输出效果,提高了手语识别系统的鲁棒性和准确性。
本发明授权一种基于LSTM和NLP的手语识别方法及系统在权利要求书中公布了:1.一种基于LSTM和NLP的手语识别方法,用于从手语视频或实时手语画面中识别手语词汇序列,并通过自然语言生成技术输出符合语言规范的手语语句,其特征在于:所述手语识别方法包括如下步骤: 步骤1、模型训练阶段,具体包括如下步骤: 步骤1-1、给定手语词元数据集D={d1,d2,…,dn},其中di表示手语词元,di={vedioi,wordi},vedioi表示手语词元di对应的手语动作视频,wordi表示与手语词元对应的自然语言词元,将定手语词元数据集D中的每个手语词元di转换为时序关键点序列数据ti,从而生成与原始手语词元数据集D对应的时序关键点序列样本数据集T={t1,t2,…,tn}; 步骤1-2、以步骤1-1得到的时序关键点序列样本数据集T为输入,训练LSTM神经网络模型,生成基于LSTM的手语词元识别模型LSTM-SL; 步骤1-3、给定由若干手语文本集构建的手语常用语料库K={k1,k2,…,kn},其中ki为包含若干手语词元的文本,根据手语常用语料库K计算手语词元表征四元组序列样本数据集Q,具体包括如下步骤: 步骤1-3-1、利用分词技术提取手语常用语料库K中每个文本ki中的词元构成与手语常用语料库K对应的手语相关自然语言词元集NW={wordi|wordi∈K};计算手语相关自然语言词元集NW中各手语词元wordi在手语常用语料库K中索引位置idxi和出现频率freqi,进而构造词元-词频三元组序列P,其中P[i]=idxi,wordi,freqi; 步骤1-3-2、以步骤1-3-1构造的词元-词频三元组序列P为输入,对于P中的每个元素P[i]=idxi,wordi,freqi,根据其词频大小freqi计算对应的手语词元wordi的权重按照下式计算: 其中α为平滑常数,k为权重系数,SW为手语相关自然语言词元集,最终生成与P对应的手语词元表征四元组序列样本数据集Q,其中Q[i]=idxi,wordi,freqi,weighti; 步骤1-4、以步骤1-3得到的手语词元表征四元组序列样本数据集Q为输入,训练word2vec模型,生成基于word2vec的手语语句自然语言生成模型W2V-SL; 步骤2、手语识别阶段,具体包括如下步骤: 步骤2-1、对于待识别的手语视频或实时手语画面,把连续的手语动作转换为对应的手语词元时序关键点序列Tw={tw1,tw2,…,twn},输入到步骤1-2的手语词元识别模型LSTM-SL中,生成手语词元预测序列S=s1,s2,…,sn,其中si表示模型预测的手语词元; 步骤2-2、利用滑动窗口机制优化手语词元预测序列S语义,生成手语预测序列Sw=s1,s2,…,sk,利用滑动窗口优化手语词元预测序列S的语义性具体为:对于手语词元预测序列S=s1,s2,…,sn中的手语词元si,在将手语词元序列组合成通顺手语语句的过程中,使用滑动窗口在预测序列S中进行滑动,在每个窗口中组合手语词元形成语句,具体包括如下步骤: 步骤2-2-1、初始化滑动窗口长度为h,滑动步长为1,滑动序列为手语词元预测序列S=s1,s2,…,sn; 步骤2-2-2、如果预测序列长度小于h,即nh,则直接输出手语词元预测序列Sw=S,否则,移动滑动窗口; 步骤2-2-3、当前窗口中手语词元si出现重复的预测时,仅保留第一个词元,移动滑动窗口,滑动完成后,得到手语预测序列Sw=s1,s2,…,sk,其中k≤n; 步骤2-3、将步骤2-2生成的手语预测序列Sw=s1,s2,…,sk转化为句向量V,输入词嵌入模型W2V-SL,通过与手语常用语句相似度比较,输出通顺度最高的符合语言规范的手语语句。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励