Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国科学院新疆理化技术研究所杨雅婷获国家专利权

中国科学院新疆理化技术研究所杨雅婷获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国科学院新疆理化技术研究所申请的专利融合词对齐适配器模块的跨语言文本表示方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115774998B

龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211657931.X,技术领域涉及:G06F40/289;该发明授权融合词对齐适配器模块的跨语言文本表示方法、装置、设备及存储介质是由杨雅婷;艾合塔木江·艾合麦提;王磊;马博;董瑞;周喜设计研发完成,并于2022-12-22向国家知识产权局提交的专利申请。

融合词对齐适配器模块的跨语言文本表示方法、装置、设备及存储介质在说明书摘要公布了:本发明公开了一种融合词对齐适配器模块的跨语言文本表示方法、装置、设备及存储介质,涉及人工智能、自然语言处理、文本建模等技术领域。具体实现方案为:构建源语言‑目标语言平行语料数据集,通过无监督词对齐算法对平行语句构建词对齐矩阵;在Transformer结构的跨语言预训练模型的每个子层之间插入词对齐适配器,通过掩码语言建模与词对齐建模联合训练,实现跨语言表示特征的语义对齐;将所述词对齐适配器模块生成的跨语言表示特征输入至任务适配器,从而实现多种跨语言下游任务。解决了现有技术中低资源小语种难以形成词对齐映射导致的跨语言表示效果较差的问题。根据本申请的技术提高了面向低资源小语种的跨语言文本表示及多种跨语言下游任务的性能。

本发明授权融合词对齐适配器模块的跨语言文本表示方法、装置、设备及存储介质在权利要求书中公布了:1.一种融合词对齐适配器模块的跨语言文本表示方法,其特征在于按下列步骤进行: a、对双语平行语料中的源语言与目标语言文本构建词对齐矩阵,所述双语平行语料输入至无监督词对齐算法模型中,设定相关参数,并获取包括源语言到目标语言和目标语言到源语言两个方向上的词对齐矩阵; b、为每个源语言-目标语言对构造一个词对齐适配器模块并初始化相应的适配器模块参数,所述词对齐适配器模块包括: 两个前馈神经网络线性层、残差连接层及归一化网络; c、将所述适配器模块插入到Transformer结构的跨语言预训练模型编码器的各个子层之间; d、将所述双语平行语料作为所述跨语言预训练模型编码器的输入,对模型进行掩码语言建模和词对齐建模联合训练,从而生成针对每个语言对具有词对齐特征的跨语言文本表示; e、在所述词对齐适配器模块后连接任务适配器模块,用于实现特定的跨语言下游任务。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院新疆理化技术研究所,其通讯地址为:830011 新疆维吾尔自治区乌鲁木齐市北京南路40号附1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。