南开大学易标获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南开大学申请的专利一种语义感知的黑盒大语言模型训练数据审计方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121256815B 。
龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511796702.X,技术领域涉及:G06F21/57;该发明授权一种语义感知的黑盒大语言模型训练数据审计方法及系统是由易标;李同设计研发完成,并于2025-12-02向国家知识产权局提交的专利申请。
本一种语义感知的黑盒大语言模型训练数据审计方法及系统在说明书摘要公布了:本发明涉及训练数据审计技术领域,具体为一种语义感知的黑盒大语言模型训练数据审计方法及系统,包括以下步骤,基于文本生成接口返回内容,分析词元及候选内容多轮采样分布,确定收敛索引,计算真实内容与候选内容的语义路径及权重,分析与参考内容差异,得到归属适配判定结果。本发明通过多轮采样行为波动追踪、区段特征动态提取、稳定性变化判断和序列级权重聚合,实现对训练数据归属信号的精细分离,针对复杂表达与多样输出构建多层次判定体系,通过张力对比信号组与归属适配判定机制优化判别准确性,形成灵敏且具适应性的训练数据成员审计策略,有效防止风险隐患遗漏并强化模型数据安全边界控制。
本发明授权一种语义感知的黑盒大语言模型训练数据审计方法及系统在权利要求书中公布了:1.一种语义感知的黑盒大语言模型训练数据审计方法,其特征在于,包括以下步骤: S1:基于文本生成接口返回内容,通过多轮采样获得候选内容,比较各词元内容出现频次,识别连续采样中频次波动的区段,判定波动趋势,得到序列分布波动特征; S2:基于所述序列分布波动特征,筛选频次波动趋于平稳的词元为收敛点,针对高频采样位置调整收敛标准,重新判别变化区段的收敛情况,得到收敛索引组; S3:基于所述收敛索引组,计算真实内容与候选内容之间的语义路径,分析语义跨度以及路径中介内容的顺序,整合路径跨度和顺序信息,得到语义证据权重集; S4:基于所述语义证据权重集,筛选具有信息变化的内容位置,判断内容位置点的前后内容变化范围,对窗口内的语义支撑变化和信息波动逐一配对,得到张力对比信号组; S5:基于所述张力对比信号组,调整与非成员参考内容的配对方式,分析当前样本与参考内容的差异,依据匹配度优化判定界线,并判断困惑与语义支撑的分布,得到归属适配判定结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南开大学,其通讯地址为:300071 天津市南开区卫津路94号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励