广州大学王杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州大学申请的专利一种基于深度学习技术的大规模鸟声识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119418708B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411525344.4,技术领域涉及:G10L17/26;该发明授权一种基于深度学习技术的大规模鸟声识别方法是由王杰;胡涛;李金晖;袁旻忞设计研发完成,并于2024-10-29向国家知识产权局提交的专利申请。
本一种基于深度学习技术的大规模鸟声识别方法在说明书摘要公布了:本申请涉及人工智能与鸟类生态学交叉领域,其具体地公开了一种基于深度学习技术的大规模鸟声识别方法,该方法通过项目区域录音设备采集鸟声音频,利用Birdaudiodetectionchallenge2018数据集训练鸟声事件检测模型,并用野外录音数据进行类别预测,分离出有效鸟声和背景噪声;同时结合中国观鸟记录中心的鸟种目录和Xeno‑Canto的音频文件,构建鸟声识别数据集,使用背景噪声和鸟声识别数据集训练鸟声识别模型,并进行验证;最终,将有效鸟声数据输入模型进行标签预测,以识别鸟声。本发明旨在通过深度学习技术,对在建项目区域开展广泛的鸟类声音识别,从而节省数据处理成本,提高复杂场景下的识别准确率。
本发明授权一种基于深度学习技术的大规模鸟声识别方法在权利要求书中公布了:1.一种基于深度学习技术的大规模鸟声识别方法,其特征在于,包括: S1、使用项目区域录音设备采集项目区域附近的鸟声音频以得到野外录音数据; S2、将从鸟声事件检测的竞赛Birdaudiodetectionchallenge2018-DCASETask3中获取的三个数据集作为鸟声事件检测数据集,用于训练鸟声事件检测模型; S3、将所述野外录音数据输入到训练后的鸟声事件检测模型中进行类别预测,以得到有效鸟声数据和背景噪声数据; S4、从中国观鸟记录中心获取项目地区记录到的鸟种目录,同时在Xeno−Canto中下载对应鸟种的音频文件,并对所述音频文件进行数据预处理操作以得到鸟声识别数据集; S5、使用所述背景噪声数据和所述鸟声识别数据集来训练鸟声识别模型; S6、对训练后的鸟声识别模型进行验证; S7、将所述有效鸟声数据输入到所述鸟声识别模型中进行标签预测,以得到识别结果; 其中,在所述鸟声事件检测模型和所述鸟声识别模型的构建过程中,将所述鸟声事件检测数据集中的频谱图和所述鸟声识别数据集中的频谱图分别作为输入,并选择ECAPA-TDNN模型作为模型基础架构,具体的模型构建过程为: 对鸟声事件检测数据集中的频谱图和鸟声识别数据集中的频谱图分别进行频带分割预处理,生成具有不同频带特征的子带Z; 对分割后的频带特征进行L2归一化处理,并连接全连接层以增加特征之间的复杂关联性; 采用基于稀疏矩阵的加速策略,使用COO存储格式,对稀疏矩阵中的非零元素进行矩阵乘法运算,以提高计算效率和资源利用率; 使用ECAPA-TDNN模型捕捉频谱图的语音特征,其中ECAPA-TDNN模型结合了膨胀卷积、Res2Net结构和SENet模块; 在ECAPA-TDNN模型的输出后接上全连接层,将特征空间映射到类别空间; 其中,鸟声事件检测模型的全连接层输出2个节点,其输出的数值经过softmax函数后分别表示鸟声样本和噪声样本的概率,鸟声识别模型的全连接层输出179个节点,其输出的数值经过softmax函数后分别表示179种鸟类的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州大学,其通讯地址为:510006 广东省广州市大学城外环西路230号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励