Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华东交通大学胡影峰获国家专利权

华东交通大学胡影峰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华东交通大学申请的专利一种基于多语义空间的机器译文质量估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119005214B

龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411498075.7,技术领域涉及:G06F40/51;该发明授权一种基于多语义空间的机器译文质量估计方法是由胡影峰;李茂西设计研发完成,并于2024-10-25向国家知识产权局提交的专利申请。

一种基于多语义空间的机器译文质量估计方法在说明书摘要公布了:本发明公开一种基于多语义空间的机器译文质量估计方法,分为机器译文质量估计模型训练和机器译文质量估计;模型训练步骤为:利用对话大语言模型生成伪参考译文和回译;提取在源语言语义空间的机器译文质量特征;提取在目标语言语义空间的机器译文质量特征;提取在跨语言语义空间的机器译文质量特征;提取多语义空间机器译文质量特征向量;预测基于多语义空间的机器译文质量得分;训练基于多语义空间的机器译文质量估计模型。机器译文质量估计方法步骤为:对源语言句子和待质量估计的机器译文进行规范化处理;将规范化处理后的源语言句子和机器译文输入训练后的基于多语义空间的机器译文质量估计模型,预测机器译文质量得分。

本发明授权一种基于多语义空间的机器译文质量估计方法在权利要求书中公布了:1.一种基于多语义空间的机器译文质量估计方法,分为机器译文质量估计模型训练和机器译文质量估计;其中机器译文质量估计模型训练,其特征在于:方法步骤如下: 步骤S1,获取训练集,对训练集进行规范化处理,获得规范化处理后的训练集; 训练集由不同的多个样本组成,每个样本包括源语言句子、机器译文和机器译文的人类评价分值; 步骤S2,利用对话大语言模型生成伪参考译文和回译; 步骤S3,提取在源语言语义空间的机器译文质量特征; 步骤S4,提取在目标语言语义空间的机器译文质量特征; 步骤S5,提取在跨语言语义空间的机器译文质量特征; 步骤S6,提取多语义空间机器译文质量特征向量; 将步骤S3中在源语言语义空间的机器译文质量特征、步骤S4中在目标语言语义空间的机器译文质量特征和步骤S5中在跨语言语义空间的机器译文质量特征进行拼接,输入到多头自注意力网络层,获取多语义空间机器译文质量特征向量; 步骤S7,预测基于多语义空间的机器译文质量得分; 将步骤S6中多语义空间机器译文质量特征向量输入到前馈神经网络层,预测基于多语义空间的机器译文质量得分; 步骤S8,训练基于多语义空间的机器译文质量估计模型; 根据步骤S7中预测的基于多语义空间的机器译文质量得分和步骤S1中规范化处理后的训练集内机器译文的人类评价分值,通过最小化在训练集上的均方差损失来优化基于多语义空间的机器译文质量估计模型的参数,得到训练后的基于多语义空间的机器译文质量估计模型; 其中机器译文质量估计,还包括有以下步骤: 步骤S9,对源语言句子和待质量估计的机器译文进行规范化处理; 步骤S10,将步骤S9中规范化处理后的源语言句子和机器译文输入至步骤S8中训练后的基于多语义空间的机器译文质量估计模型,预测机器译文质量得分; 步骤S2中利用对话大语言模型生成伪参考译文和回译,具体为: 步骤S21,使用翻译提示将规范化处理后的训练集内每个样本中源语言句子输入到对话大语言模型,使源语言句子生成对应目标语言的翻译; 1; 其中,pref表示对话大语言模型生成的源语言句子的目标语言的翻译,LLM表示对话大语言模型输出函数,promptpref表示正向翻译提示,src表示源语言句子; 步骤S22,将源语言句子的目标语言的翻译pref作为机器译文的伪参考译文; 步骤S23,使用翻译提示将规范化处理后的训练集内每个样本中机器译文输入到对话大语言模型,使机器译文生成对应源语言的翻译; 2; 其中,bt表示对话大语言模型生成的机器译文的源语言的翻译,mt表示机器译文; 步骤S24,将机器译文的源语言的翻译bt作为源语言句子的回译; 步骤S3中提取在源语言语义空间的机器译文质量特征;具体为: 步骤S31,将规范化处理后的训练集内每个样本中源语言句子和回译拼接成源语言句对序列; 3; 其中,Xsrc_bt表示源语言句对序列,符号“[s]”表示源语言句对序列的起始符,符号“[sep]”表示句子间的分隔符,符号“[s]”表示源语言句对序列的结束符; 步骤S32,将源语言句对序列输入到跨语言预训练模型X-MOD中,提取在源语言语义空间统一表征; 4; 5; 其中,Hsrc_bt表示跨语言预训练模型X-MOD生成的源语言句对序列的子词级表征,X-MOD表示跨语言预训练模型X-MOD输出函数,hsrc_bt表示在源语言语义空间统一表征,即源语言句对序列的子词级表征的起始符“[s]”的表征,符号“[0]”表示取表征数组的第一个元素操作; 步骤S33,将规范化处理后的训练集内每个样本中源语言句子和回译分别独立输入到跨语言预训练模型X-MOD中,提取源语言句子子词级表征和回译子词级表征; 6; 7; 其中,Hsrc表示源语言句子子词级表征,Hbt表示回译子词级表征; 步骤S34,通过平均池化和交互推理增强获得在源语言语义空间独立增强表征; 8; 9; 10; 其中,hsrc表示源语言句子整体表征,hbt表示回译整体表征,vsrc_bt表示在源语言语义空间独立增强表征;AvgPool表示平均池化函数,“⊕”为向量拼接操作,用于融合多方面表征信息,符号“-”为向量间的减法操作,用于捕捉句对间的差异特征,符号“||”表示向量逐元素取绝对值操作,“”为向量逐元素相乘操作,用于获取向量的交互特征; 步骤S35,将在源语言语义空间统一表征和在源语言语义空间独立增强表征拼接,获取在源语言语义空间的机器译文质量特征; 11; 其中,esrc_bt表示在源语言语义空间的机器译文质量特征。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东交通大学,其通讯地址为:330000 江西省南昌市经济技术开发区双港东大街808号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。