Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东北大学魏阳杰获国家专利权

东北大学魏阳杰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东北大学申请的专利一种声音事件检测的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119993202B

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510107923.5,技术领域涉及:G10L25/51;该发明授权一种声音事件检测的方法是由魏阳杰;王壵壵;齐泽康设计研发完成,并于2025-01-23向国家知识产权局提交的专利申请。

一种声音事件检测的方法在说明书摘要公布了:本申请提出一种声音事件检测的方法,属于声音事件检测技术领域,包括:获取待检测的音频信号;对待检测的音频信号进行预处理;对数据预处理后的音频信号进行数据增强;对数据增强后的音频信号进行特征提取;对提取的特征进行上下文信息提取,得到第一分支特征;将数据增强后的音频信号输入预训练的基于Transfomer的音频教师学生模型,得到第二分支特征;将第一分支特征与第二分支特征拼接后输入分类器,得到待检测的音频信号的声音事件检测结果。本申请针对不同声音事件都能够获取到其相应的足够多的背景信息,提高了模型的多尺度特征捕捉能力。

本发明授权一种声音事件检测的方法在权利要求书中公布了:1.一种声音事件检测的方法,其特征在于,包括: 获取待检测的音频信号; 对所述待检测的音频信号进行预处理; 对数据预处理后的音频信号进行数据增强;对数据增强后的音频信号进行特征提取; 对提取的特征进行上下文信息提取,得到第一分支特征; 将数据增强后的音频信号输入预训练的基于Transfomer的音频教师学生模型,得到第二分支特征; 将第一分支特征与第二分支特征拼接后输入分类器,得到待检测的音频信号的声音事件检测结果; 所述对数据预处理后的音频信号进行数据增强,包括: 将数据预处理后的音频信号沿着时间轴随机移动时间帧,得到第一增强结果; 采用混合参数对预处理后的音频信号进行随机混合,得到第二增强结果; 根据掩码选取需要掩蔽的时间窗口,对选定的时间窗口进行连续时间帧的屏蔽,使得预处理后的音频信号对应的部分为空,得到第三增强结果; 将第一增强结果、第二增强结果以及第三增强结果作为原始音频信号的数据增强的结果; 所述对数据增强后的音频信号进行特征提取,包括: 将数据增强后的音频信号输入CNN模块进行初步特征提取,得到初始特征; 将初始特征输入多个注意力机制的频率动态卷积模块进行深入特征提取,得到深入特征提取结果; 所述将数据增强后的音频信号输入CNN模块进行初步特征提取,得到初始特征,包括: 将数据预处理后的音频信号输入CNN层进行特征提取; 将CNN层的输出输入到第一归一化层进行归一化处理; 将归一化处理后的结果输入到第一GLU层进行线性处理; 将线性处理后的结果输入到第一池化层进行池化处理; 将池化后的结果进行正则化,得到正则化结果,将正则化结果作为初始特征; 所述将初始特征输入多个注意力机制的频率动态卷积模块进行深入特征提取,得到深入特征提取结果,包括: 步骤S4.2.1:将所述初始特征进行频率动态卷积; 步骤S4.2.2:对频率动态卷积结果输入第二归一化层进行归一化处理,并将归一化处理的结果作为第一特征; 步骤S4.2.3:将归一化处理的结果分别输入到第一卷积核以及第二卷积核中,分别得到第一卷积核输出以及第二卷积核输出; 步骤S4.2.4:将第一卷积核输出输入第一卷积层,得到第一卷积结果; 步骤S4.2.5:将第二卷积核输出输入第二卷积层,得到第二卷积结果; 步骤S4.2.6:将第一卷积结果与第二卷积结果进行拼接,得到第一拼接结果; 步骤S4.2.7:将第一拼接结果输入第二池化层进行池化处理; 步骤S4.2.8:将池化处理结果输入到第三卷积层; 步骤S4.2.9:将第三卷积层输出输入到Sigmoid激活函数中,得到第一注意力权重以及第二注意力权重; 步骤S4.2.10:将第一卷积结果与第一注意力权重相乘,得到第一相乘结果; 步骤S4.2.11:将第二卷积结果与第二注意力权重相乘,得到第二相乘结果; 步骤S4.2.12:将第一相乘结果与第二相乘结果进行拼接,得到第二拼接结果; 步骤S4.2.13:将第二拼接结果与第一特征相乘,得到动态卷积结构提取特征结果; 步骤S4.2.14:将动态特征结构提取特征结果输入第二GLU层得到线性处理结果; 步骤S4.2.15:将线性处理结果经过第三池化层进行池化处理,得到第一次深入特征提取结果; 步骤S4.2.16:将第一次深入特征提取结果作为初始特征,返回步骤S4.2.1,直到达到预设定重复次数,将最后一次深入特征提取结果作为最终深入特征提取结果; 所述频率动态卷积,用于对所述初始特征进行频率维度切分加权,计算式如下: Gk=πkf,x; ykt,f=Wk*Xt,f+B; 其中,Yt,f,x为频率动态卷积结果,t为时间,f为频率,k表示第k个基核,N表示基核的总数,x为输入数据,πk为第k个基核的注意力函数,ykt,f为第k个基核的输出,Gk为第k个基核的注意力权重,Wk为输入的权重矩阵,B为偏置矩阵,Xt,f为初始特征。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路三号巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。