当前位置 : 首页 > 专利喜报 > 新东方教育科技集团有限公司高兴龙获国家专利权

新东方教育科技集团有限公司高兴龙获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉新东方教育科技集团有限公司申请的专利语音大模型的训练方法及装置、设备、介质获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN121438813B 。

龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202512003796.7，技术领域涉及：G10L15/06；该发明授权语音大模型的训练方法及装置、设备、介质是由高兴龙设计研发完成，并于2025-12-29向国家知识产权局提交的专利申请。

本语音大模型的训练方法及装置、设备、介质在说明书摘要公布了：本公开提供一种语音大模型的训练方法及装置、设备、介质，该语音大模型的训练方法包括：将训练语音数据子集输入语音大模型，获取语音大模型中大语言模型模块输出的、训练语音数据子集的预测概率分布；根据预测概率分布和所述真实概率分布，确定熵加权交叉熵损失函数，熵加权交叉熵损失函数的熵权重基于当前时刻的预测概率分布的分布熵确定；以最小化熵加权交叉熵损失函数为目标，更新大语言模型模块的参数和训练语音数据子集的语音识别标签。在该语音大模型的训练方法中，在熵加权交叉熵损失函数中增加熵权重，一定程度上解决预测概率分布的不确定性问题，使用基于预测概率分布的分布熵的自反馈信号进行迭代，不断提升语音大模型的语音识别效果。

本发明授权语音大模型的训练方法及装置、设备、介质在权利要求书中公布了：1.一种语音大模型的训练方法，其中，所述语音大模型包括文本编码器、音频编码器、桥接器和大语言模型模块，所述文本编码器用于基于语音数据对应的文本生成文本词元，所述音频编码器用于基于语音数据生成音频词元，所述桥接器用于基于文本词元和音频词元生成融合词元，所述大语言模型模块用于基于所述融合词元生成语音识别结果，所述方法包括：获取训练语音数据集合，其中，所述训练语音数据集合包括多条训练语音数据，所述多条训练语音数据分别对应有语音识别标签；对所述大语言模型模块进行多轮训练过程，每轮所述训练过程包括以下步骤：从所述训练语音数据集合中，确定所述训练过程的训练语音数据子集，以及，根据所述训练语音数据子集的语音识别标签，确定所述训练语音数据子集的真实概率分布；将所述训练语音数据子集输入所述语音大模型，获取所述语音大模型中所述大语言模型模块输出的、所述训练语音数据子集的预测概率分布；根据所述预测概率分布和所述真实概率分布，确定熵加权交叉熵损失函数，其中，所述熵加权交叉熵损失函数的熵权重基于当前时刻的所述预测概率分布的分布熵确定，确定所述熵加权交叉熵损失函数的熵权重的操作包括：根据所述当前时刻的所述预测概率分布，确定所述当前时刻的所述预测概率分布的分布熵；响应于所述当前时刻的所述预测概率分布的分布熵小于第一熵阈值，确定所述当前时刻的所述预测概率分布的分布熵越大，所述熵加权交叉熵损失函数的熵权重越小；响应于所述当前时刻的所述预测概率分布的分布熵大于或等于所述第一熵阈值，确定所述当前时刻的所述预测概率分布的分布熵越大，所述熵加权交叉熵损失函数的熵权重越大；其中，所述当前时刻的所述预测概率分布的分布熵小于第一熵阈值时的所述熵加权交叉熵损失函数的熵权重大于所述当前时刻的所述预测概率分布的分布熵大于或等于所述第一熵阈值时的所述熵加权交叉熵损失函数的熵权重；以最小化所述熵加权交叉熵损失函数为目标，更新所述大语言模型模块的参数和所述训练语音数据子集的语音识别标签。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人新东方教育科技集团有限公司，其通讯地址为：100080 北京市海淀区海淀中街6号9层；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

新东方教育科技集团有限公司高兴龙获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务