苏州大学汪磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州大学申请的专利一种基于语音与超声波信号的双模态身份认证方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121459851B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610014549.9,技术领域涉及:G10L25/51;该发明授权一种基于语音与超声波信号的双模态身份认证方法是由汪磊;黄诗梦设计研发完成,并于2026-01-07向国家知识产权局提交的专利申请。
本一种基于语音与超声波信号的双模态身份认证方法在说明书摘要公布了:本发明公开了一种基于语音与超声波信号的双模态身份认证方法。该方法利用设备内置扬声器发射正交频分复用调制的超声波,并同步采集包含语音与超声反射的混合信号;经分离后,将语音信号转换为语谱图,对超声信号进行发音器官定位、分段去趋势及多尺度谱图转换以提取抗干扰的发音动作特征;通过双流神经网络分别提取语音与超声的深度特征,并采用质量感知通道门控融合模块根据信号质量动态加权融合,生成与说话内容无关的身份嵌入向量;在注册阶段构建说话人模板并计算个性化阈值,认证阶段通过余弦相似度比对实现身份判定。本发明通过融合语音内容与超声活体动作特征,显著提升了系统在噪声环境下的鲁棒性及对重放、合成等欺骗攻击的防御能力。
本发明授权一种基于语音与超声波信号的双模态身份认证方法在权利要求书中公布了:1.一种基于语音与超声波信号的双模态身份认证方法,其特征在于,包括以下步骤: 步骤S1:在说话人发出语音指令的过程中,向说话人的发音区域发射基于正交频分复用调制技术生成的预设频率范围的超声波信号,得到包含语音指令与由说话人发音动作调制的超声波反射分量的混合宽带信号; 步骤S2:从所述混合宽带信号中分离出语音信号和由说话人发音动作调制的超声波反射信号; 步骤S3:将所述语音信号转换为语音频谱图;对所述超声波反射信号依次进行分段去趋势噪声抑制和多尺度短时傅里叶变换,生成表征发音动作的超声谱图; 步骤S4:将所述语音频谱图输入预训练的语音编码器,提取语音特征向量;将所述超声谱图输入超声编码器,提取超声特征向量; 步骤S5:通过质量感知融合模块,根据所述语音信号与所述超声波反射信号的实时质量评估结果,动态加权融合所述语音特征向量和所述超声特征向量,生成与说话内容无关的说话人身份嵌入向量; 步骤S6:计算基于待认证语音对应的所述说话人身份嵌入向量与预设的注册模板向量之间的相似度,并将所述相似度与预设的认证阈值进行比较,根据比较结果完成身份验证; 其中,所述语音编码器、所述超声编码器和所述质量感知融合模块通过联合损失函数进行训练,所述联合损失函数包含对比损失项和交叉熵分类损失项; 所述对比损失项被配置为:减小同一说话人不同语音内容对应的身份嵌入向量之间的距离,增大不同说话人相同语音内容对应的身份嵌入向量之间的距离; 所述交叉熵分类损失项被配置为:对说话人身份进行分类监督学习; 其中,步骤S5中,生成与说话内容无关的说话人身份嵌入向量的方法如下: 将所述语音特征向量与所述超声特征向量沿通道维度拼接,生成联合特征表示; 基于所述联合特征表示,通过构建的权重估计网络,为所述语音特征向量与所述超声特征向量的各个通道,分别生成对应的第一模态通道权重和第二模态通道权重;所述权重估计网络通过分析联合特征表示来隐式评估各模态的信号质量; 使用所述第一模态通道权重对所述语音特征向量进行通道级加权,得到加权后的语音特征;使用所述第二模态通道权重对所述超声特征向量进行通道级加权,得到加权后的超声特征; 将所述加权后的语音特征与所述加权后的超声特征进行相加融合,生成与说话内容无关的说话人身份嵌入向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州大学,其通讯地址为:215299 江苏省苏州市吴江区久泳西路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励