Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连理工大学姚念民获国家专利权

大连理工大学姚念民获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连理工大学申请的专利一种基于深度学习的文本生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116226378B

龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310040513.4,技术领域涉及:G06F16/353;该发明授权一种基于深度学习的文本生成方法是由姚念民;刘晗旭设计研发完成,并于2023-01-13向国家知识产权局提交的专利申请。

一种基于深度学习的文本生成方法在说明书摘要公布了:本发明属于自然语言处理技术领域,涉及一种基于深度学习的文本生成方法。包括:收集目标任务数据集,增加损失函数,在目标任务数据集上重新训练初始生成模型;构建用于训练打分模型的数据集,包括数据集的生成以及划分等操作;构建打分模型,使用打分模型训练数据集对打分模型进行训练至收敛,通过测试集验证模型性能;将打分模型与生成模型相结合,在生成模型的解码阶段插入打分模块,通过打分模型的输出调整候选词的概率分布。经过本发明的优化后,文本生成模型的生成质量明显提升,其具体表现在,在以生成结果与参考标准相匹配程度为评价指标的任务中,生成结果的指标分数明显提高。

本发明授权一种基于深度学习的文本生成方法在权利要求书中公布了:1.一种基于深度学习的文本生成方法,其特征在于,包括如下步骤: 步骤1:收集目标任务数据集,增加损失函数,在目标任务数据集上重新训练文本的初始生成模型G0; 步骤2:构建用于训练打分模型的数据集,包括数据集的生成以及划分; 步骤3:构建打分模型Mscore,使用步骤2所述数据集对打分模型进行训练至收敛,通过测试集验证打分模型性能; 步骤4:将打分模型与生成模型相结合,在生成模型的解码阶段插入打分模块,通过打分模型的输出调整候选词的概率分布; 进一步地,所述步骤1包括以下步骤: 1.1根据目标任务,收集相关数据集Dgen,其中每一条数据包括生成模型的输入和生成结果的标准参考;选择初始生成模型G0的结构,要求初始生成模型G0可以在数据集Dgen上进行训练和推断; 1.2确定表示模型的结构,构建表示模型Mr;在数据集Dgen上训练表示模型Mr,使表示模型Mr可以完成从句子到向量的映射; 1.3设计均方误差损失函数Lr,公式如下: 其中zi表示在训练过程中模型生成的第i个句子输入表示模型Mr后得到的向量,即Mry,该句子由表示模型最后一层的输出依据贪心算法采样得到;表示第i个句子的标准生成结果由表示模型Mr映射后的向量,即 将均方误差损失与初始生成模型G0的损失LLM相加,即: L=Lr+LLM 将L作为新的损失函数重新训练初始生成模型G0,得到优化后的生成模型G1; 进一步地,所述步骤2包括以下步骤: 2.1令优化后的生成模型G1在数据集Dgen上完成生成任务,将每一句的生成结果y与对应的原输入x、标准参考一一匹配,组成全新的数据集,即打分模型数据集Dscore; 2.2将打分模型数据集Dscore划分成训练集、验证集和测试集,分别用于打分模型Mscore的训练、验证和测试; 进一步地,所述步骤3包括以下步骤: 3.1构建打分模型Mscore,确定网络结构,设置合理超参数; 3.2从打分模型数据集Dscore中获取数据,将每条数据拆分为原输入x、生成结果y和标准参考将生成结果y从随机位置r截断,取句子开头到断点的片段y[0:r],根据当前任务的评价指标对该片段进行评价,将原输入x和生成结果片段y[0:r]共同作为打分模型的输入,将评价分数Seval作为每个输入对应的标签; 3.3开始执行打分模型Mscore的训练,选择损失函数和优化器,迭代多轮训练直至收敛,通过验证集调整超参数以提升性能,最大化模型为生成结果片段打分的准确度; 3.4使用测试集检验模型Mscore的泛化能力,保证训练完成的打分模型具有对于目标文本生成任务的泛用性; 进一步地,所述步骤4包括以下步骤: 4.1使用测试集进行生成,在优化后的生成模型G1的解码阶段,根据模型输出的概率分布,选择概率最高的k个词作为候选词,获取所有候选词的概率,构成k维向量p0,其中,k为超参数; 4.2将候选词分别拼接在当前生成阶段已生成的文本末端,组成k个候选句子片段,利用打分模型对句子片段进行打分,获取对应的输出分数,构成k维向量spre; 4.3将候选词的概率与对应每个候选句子片段的分数结合,得到k维向量pfinal,代表调整后的概率分布,具体公式如下,其中α是超参数,用于调节打分模型对生成过程的影响程度: pfinal=αp0+1-αspre 4.4根据不同的任务要求选择采样策略,依调整后的概率分布pfinal采样,得到句子下一位置的生成结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。