平安科技(深圳)有限公司凌天东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利基于人工智能的语音翻译方法、装置、计算机设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119647490B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411708962.2,技术领域涉及:G06F40/58;该发明授权基于人工智能的语音翻译方法、装置、计算机设备及介质是由凌天东;程宁;王健宗设计研发完成,并于2024-11-26向国家知识产权局提交的专利申请。
本基于人工智能的语音翻译方法、装置、计算机设备及介质在说明书摘要公布了:本发明适用于数字医疗技术领域,尤其涉及一种基于人工智能的语音翻译方法、装置、计算机设备及介质。本发明使用声学编码器对目标语音进行特征编码,得到声学特征序列,使用边界预测器对声学特征序列进行边界预测,得到每个特征值预测为边界的概率值并作为对应特征值的权重,对所有的特征值进行加权求和得到声学收缩特征,使用语义编码器提取声学收缩特征中的语义特征,使用解码器解码语义特征,得到在预设的目标语言下的目标翻译文本,通过对声学特征进行收缩,消除了语音特征和文本特征之间的长度差距问题,在进行语音翻译时有效地继承了预先训练的模型知识,提高了目标翻译文本的准确性,在数字医疗技术领域提高了医生的工作效率和工作质量。
本发明授权基于人工智能的语音翻译方法、装置、计算机设备及介质在权利要求书中公布了:1.一种基于人工智能的语音翻译方法,其特征在于,所述语音翻译方法包括: 获取待翻译的目标语音,使用训练好的声学编码器对所述目标语音进行特征编码,得到由特征值排列构成的声学特征序列; 使用训练好的边界预测器对所述声学特征序列进行边界预测,得到所述声学特征序列中每个所述特征值预测为边界的概率值; 将每个特征值对应的概率值作为对应特征值的权重,根据每个特征值对应的权重对所有的特征值进行加权求和,得到声学收缩特征; 使用训练好的语义编码器对所述声学收缩特征进行特征编码,得到语义特征,使用训练好的解码器对所述语义特征进行解码,得到在预设的目标语言下对应所述目标语音的目标翻译文本; 所述训练好的声学编码器、训练好的边界预测器、训练好的语义编码器和训练好的解码器的训练过程包括: 获取预训练好的声学编码器、预训练好的语义编码器、预训练好的解码器、边界预测器,以及若干个语音样本和每个语音样本对应的实际翻译文本; 针对任一语音样本,使用所述预训练好的声学编码器对所述语音样本进行特征编码,得到由特征值样本构成的声学特征序列样本; 使用所述边界预测器对所述声学特征序列样本进行边界预测,得到所述声学特征序列样本中每个所述特征值样本预测为边界的概率值; 将每个特征值样本对应的概率值作为对应特征值样本的权重,根据每个特征值样本对应的权重对所有的特征值样本进行加权求和,得到声学收缩特征样本; 使用预训练好的语义编码器对所述声学收缩特征样本进行特征编码,得到语义特征样本,使用预训练好的解码器对所述语义特征样本进行解码,得到在预设的目标语言下对应所述语音样本的目标翻译文本样本; 根据所述实际翻译文本和对应的所述目标翻译文本样本计算模型损失,根据所述模型损失修正所述预训练好的声学编码器、所述预训练好的语义编码器、所述预训练好的解码器和所述边界预测器的参数,直至所述模型损失收敛,得到训练好的声学编码器、训练好的边界预测器、训练好的语义编码器和训练好的解码器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励