当前位置 : 首页 > 专利喜报 > 山东浪潮科学研究院有限公司邵嘉豪获国家专利权

山东浪潮科学研究院有限公司邵嘉豪获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉山东浪潮科学研究院有限公司申请的专利基于保真度的迭代式文本精炼方法、系统、设备及介质获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN120706380B 。

龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202511195539.1，技术领域涉及：G06F40/166；该发明授权基于保真度的迭代式文本精炼方法、系统、设备及介质是由邵嘉豪;张磊;王景坤;张吉臣;李雪设计研发完成，并于2025-08-26向国家知识产权局提交的专利申请。

本基于保真度的迭代式文本精炼方法、系统、设备及介质在说明书摘要公布了：本发明公开了基于保真度的迭代式文本精炼方法、系统、设备及介质，属于自然语言处理和人工智能技术领域，本发明要解决的技术问题为如何克服单向生成的局限性，实现对生成文本的自我评估和迭代优化，从而确保最终输出的高度忠实、简洁和连贯，采用的技术方案为：采集一组结构化的源信息集合；初始化一个目标文本序列，目标文本序列的长度根据预估的目标文本长度确定，并全部由特殊的[MASK]词元填充；进入迭代式精炼循环，每个迭代生成过程具体为：利用一个预训练的逐步去噪语言模型，对目标文本序列进行去噪处理，生成一个中间版本文本；通过内容保真度评估模块对中间版本文本中的片段进行评估。

本发明授权基于保真度的迭代式文本精炼方法、系统、设备及介质在权利要求书中公布了：1.一种基于保真度的迭代式文本精炼方法，其特征在于，该方法具体如下：采集一组结构化的源信息集合；其中，结构化的源信息集合包括至少一个核心观点及对应的支撑材料；初始化一个目标文本序列，目标文本序列的长度根据预估的目标文本长度确定，并全部由特殊的[MASK]词元填充；进入迭代式精炼循环，每个迭代生成过程具体为：利用一个预训练的逐步去噪语言模型，对目标文本序列进行去噪处理，生成一个中间版本文本；通过内容保真度评估模块对中间版本文本中的片段进行评估，识别缺乏源信息支持、内容冗余或逻辑不完整的片段；根据内容保真度评估模块的评估结果，对已识别的缺乏源信息支持、内容冗余或逻辑不完整的片段进行选择性遮盖以待重构；重复迭代生成过程，直至达到预设的迭代次数或文本质量满足收敛条件，获取精炼后的目标文本；其中，预训练的逐步去噪语言模型通过一个掩码预测目标函数进行训练，在训练时，随机遮盖输入文本的一部分词元，即将其替换为[MASK]，再要求逐步去噪语言模型根据未被遮盖的上下文预测并恢复被遮盖的原始词元，损失函数采用负对数似然，形式具体如下：；其中，表示去噪损失；表示原始清晰训练文本；表示被随机遮盖的词元集合；表示未被遮盖的词元；表示补集；表示子集；表示被遮盖的词元集合；表示未被遮盖的上下文词元；表示源信息集合；表示逐步去噪语言模型预测被遮盖词元的概率分布；是数学期望符号，表示对所有可能的随机遮盖情况计算平均值；表示通过对同一条文本进行多次不同的随机遮盖，计算所有情况下损失的平均值，确保逐步去噪语言模型学习到的是通用的修复能力，而非针对特定遮盖模式的记忆，通过最小化损失函数，逐步去噪语言模型能够学习到语境理解和内容修复能力；迭代式精炼循环中的去噪处理是一个反向演化过程，去噪处理的目标是将当前带有遮盖的文本序列以及作为引导条件的源信息集合输入到逐步去噪语言模型中，逐步去噪语言模型预测在[MASK]位置上最合适的词元，并对已生成的词元进行优化，采样得到一个的中间版本文本，公式如下：；其中，表示时间步的文本状态，是一个部分清晰、部分被遮盖的文本序列；表示作为条件的源信息集合，全程引导逐步去噪语言模型生成与源信息内容一致的文本；表示总迭代步数；表示逐步去噪语言模型学习到的核心内容，即表示学习到的反向转移核函数反向转移核函数，反向转移核函数是一个以为参数的概率分布，用于在给定当前噪声水平高于设定阈值的文本和源信息集合的条件下，计算出所有可能的、噪声水平低于设定阈值的中间版本文本的概率；∼符号表示“从…中采样”，即生成过程是概率性的，从定义的概率分布中随机抽取一个最可能的结果，作为本次去噪的输出；内容保真度评估模块通过监督式核查分类器和或基于大型语言模型的逻辑推理模块进行评估；其中，监督式核查分类器用于判断待评估文本片段是否被源信息中的核心观点和支撑材料充分支持；基于大型语言模型的逻辑推理模块通过引导式推理，判断文本片段与源信息之间的支持、冗余或矛盾关系；选择性遮盖以待重构时，根据内容保真度评估模块输出的每个词元的保真度分数，通过引导式重构控制器决定下一轮迭代的重构区域，一个词元的保真度分数越低，表示相应词元越可能是错误的、无支持的或冗余的，进而相应词元被重新遮盖以待重构的概率越高；其中，词元被遮盖以待重构达到概率公式如下：；其中，符号表示“正比于”，意味着每个词元被遮盖以待重构达到概率与成正比关系；是核心项，确保保真度越低的词元越容易被选中重构；是一个小的随机扰动项，用于增加探索性，避免逐步去噪语言模型陷入局部最优；表示均匀分布采样项以增加探索多样性；表示平衡因子。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人山东浪潮科学研究院有限公司，其通讯地址为：250000 山东省济南市高新区浪潮路1036号S02号楼；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

山东浪潮科学研究院有限公司邵嘉豪获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务