深绎未来科技(广东横琴)有限公司林余楚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深绎未来科技(广东横琴)有限公司申请的专利一种针对多语种、复杂场景下的语言数据预处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120913580B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511447963.0,技术领域涉及:G10L21/0216;该发明授权一种针对多语种、复杂场景下的语言数据预处理方法是由林余楚;汪一鸣;周文凯;陈新元;林余忆设计研发完成,并于2025-10-11向国家知识产权局提交的专利申请。
本一种针对多语种、复杂场景下的语言数据预处理方法在说明书摘要公布了:本发明涉及语言数据处理技术领域,且公开了一种针对多语种、复杂场景下的语言数据预处理方法,基于AutoPrep框架的多语种、复杂场景下的语音数据预处理系统,集成语音增强、语音分割、说话人聚类、目标语音提取与质量过滤五大模块,实现语音数据的自动化、结构化处理,本方案,实现了对多语种语音信号中稳态与瞬态噪声的差异化抑制,特别是在小语种如哈萨克语、他加禄语场景中,有效提升了语音信噪比和语音特征的语言无关性,克服了现有技术中小语种缺乏专属音系处理模块而导致音素映射错误率高的问题,增强了低资源语言数据的可用性与处理效果。
本发明授权一种针对多语种、复杂场景下的语言数据预处理方法在权利要求书中公布了:1.一种针对多语种、复杂场景下的语言数据预处理方法,其特征在于:基于AutoPrep框架,音频依次流经语音增强模块、语音分割模块、说话人聚类模块、目标语音提取模块以及质量过滤模块五个模块进行处理,通过跨语言预训练模型与深度学习算法融合,实现从原始语音到结构化数据的端到端处理; 语音增强模块由动态分块、XLSR-53、BSRNN及pBSRNN核心组件构成,实现对输入音频的智能化去噪处理; 语音分割模块帧化音频将被输入至预训练的VAD模型中,该模型基于TDNN-Transformer架构,能够准确识别每帧音频属于“语音”或“非语音”; 说话人聚类模块将语音分割处理好的数据经过分块后,输入到WeSpeaker-XL模型提取说话人嵌入向量,通过计算每对嵌入向量之间的余弦相似度构建相似度矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深绎未来科技(广东横琴)有限公司,其通讯地址为:519000 广东省珠海市香洲区横琴濠江路1566号1栋101科研B室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励