合肥工业大学张旭娟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利一种基于层次跨模态注意力融合的焦虑障碍检测系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120600282B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510697601.0,技术领域涉及:G16H50/20;该发明授权一种基于层次跨模态注意力融合的焦虑障碍检测系统是由张旭娟;郭艳蓉;吴晶晶;洪日昌设计研发完成,并于2025-05-28向国家知识产权局提交的专利申请。
本一种基于层次跨模态注意力融合的焦虑障碍检测系统在说明书摘要公布了:本发明公开了一种基于层次跨模态注意力融合的焦虑障碍检测系统,应用于焦虑障碍检测技术领域,包括:模态特征编码模块:基于预训练的BERT模型提取患者文本的全局语义特征;通过堆叠双层双向长短时记忆网络捕捉患者音频特征的时序动态特性和上下文依赖信息;基于深度卷积神经网络提取患者发言视频的深层视频特征;分层跨模态注意力融合模块:基于层次化双向注意力融合策略,分别进行文本和音频模态特征的双向注意力交互融合及融合结果与视频模态特征的双向注意力交互融合;残差增强多层感知器分类决策模块:输入多模态融合特征至基于残差增强结构的多层感知器分类决策模型,得到焦虑障碍检测结果。本发明有效提高了焦虑障碍检测精度。
本发明授权一种基于层次跨模态注意力融合的焦虑障碍检测系统在权利要求书中公布了:1.一种基于层次跨模态注意力融合的焦虑障碍检测系统,其特征在于,包括: 模态特征编码模块:用于基于预训练的BERT模型提取临床访谈中患者文本的全局语义特征,得到文本模态特征;用于通过堆叠双层双向长短时记忆网络捕捉临床访谈中患者音频特征的时序动态特性和上下文依赖信息,得到音频模态特征;用于基于深度卷积神经网络提取临床访谈中患者发言视频的深层视频特征,得到视频模态特征; 通过堆叠双层双向长短时记忆网络捕捉临床访谈中患者音频特征的时序动态特性和上下文依赖信息,具体为: 通过第一预设维度的第一层双向长短时记忆网络对音频特征在时间维度上进行扩展,并将所述第一层双向长短时记忆网络的输出输入到第二预设维度的第二层双向长短时记忆网络进行深度建模,捕捉音频特征的时序动态特性和上下文依赖信息;其中,所述第二维度小于所述第一维度; 分层跨模态注意力融合模块:用于基于层次化双向注意力融合策略,分别进行所述文本模态特征和音频模态特征的双向注意力交互融合以及所述文本模态特征和音频模态特征的融合结果与所述视频模态特征的双向注意力交互融合,得到多模态融合特征; 基于层次化双向注意力融合策略,进行所述文本模态特征和音频模态特征的双向注意力交互融合,具体为: 利用多头注意力机制构建所述文本模态特征和音频模态特征的双向交互关系; 将所述文本模态特征和音频模态特征的双向交互关系与原始模态特征进行通过残差连接相加,并进行层归一化操作,得到所述文本模态特征和音频模态特征的双向注意力交互融合结果; 残差增强多层感知器分类决策模块:用于输入所述多模态融合特征至基于残差增强结构的多层感知器分类决策模型,得到焦虑障碍检测结果; 基于残差增强结构的多层感知器分类决策模型,通过三层串联的残差全连接块对所述多模态融合特征进行逐层提取与非线性变换,最终经过一个Sigmoid激活函数,得到二分类任务的预测概率; 在提取到所述患者文本的全局语义特征和所述患者发言视频的深层视频特征后,系统还包括:将提取到的特征输入改进的残差全连接块,并进行批归一化和条件Dropout处理;其中,所述改进的残差全连接块包括一个带ReLU激活的全连接层和一个维度对齐的捷径连接,当输入与输出维度不一致时,捷径路径引入线性变换以实现维度匹配。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励