浙江大学;杭州高新区(滨江)区块链与数据安全研究院顾威获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学;杭州高新区(滨江)区块链与数据安全研究院申请的专利一种兼顾通用与安全性能的大模型训练数据度量与筛选方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121303389B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511870022.8,技术领域涉及:G06N20/00;该发明授权一种兼顾通用与安全性能的大模型训练数据度量与筛选方法是由顾威;申佳润;郑天航;任奎设计研发完成,并于2025-12-12向国家知识产权局提交的专利申请。
本一种兼顾通用与安全性能的大模型训练数据度量与筛选方法在说明书摘要公布了:本发明公开了一种兼顾通用与安全性能的大模型训练数据度量与筛选方法。通过构建了一个机器学习模型,以多维度特征向量为输入、真实综合质量得分为标签进行训练。机器学习模型充当了一个低成本、高效率的代理模型,仅需对新数据集执行特征提取即可预测其质量得分,从而成功替代并绕过了监督微调、基准评测及得分计算这一整套高算力成本、高时间消耗的传统流程,实现了毫秒级的数据集筛选。该方法能够克服现有技术中数据集指标与模型最终性能相关性弱、忽视通用性与安全性权衡、以及指标权重分配主观的缺陷,实现对数据集质量的客观、全面评估。
本发明授权一种兼顾通用与安全性能的大模型训练数据度量与筛选方法在权利要求书中公布了:1.一种兼顾通用与安全性能的大模型训练数据度量与筛选方法,其特征在于,包括: S1:获取多个待评估安全数据集,以及至少一个基准大语言模型;待评估安全数据集中的样本为“问题-答案对”; S2:采用所述待评估安全数据集分别对所述基准大语言模型进行监督微调,得到已微调模型;保持微调的统一配置以保证可比性; S3:在通用性能评测基准和安全性能评测基准上,对S2中所述已微调模型进行评估,计算得到各待评估安全数据集的通用性能得分和安全性能得分;所述通用性能得分是通过计算由同一待评估数据集微调的一个或多个已微调模型所获取的通用性能得分的平均值而得到;所述安全性能得分是通过计算对应安全性能得分的平均值而得到; S4:结合S3所述得分,计算各待评估安全数据集对应的综合质量得分;所述综合质量得分为S3所述的通用性能得分与安全性能得分的加权和; S5:针对各待评估安全数据集,提取其多维度特征指标向量; 所述多维度特征指标向量由下述指标构成: 语言模型的可预期性指标; 安全响应分布差异度指标; 基于外部分类器的毒性风格指标; 多样性指标; 有效信息密度指标; S6:将S5所述多维度特征指标向量作为输入、S4所述综合质量得分作为标签,训练机器学习模型; S7:获取一新待评估数据集,执行S5所述步骤提取其多维度特征指标向量;将多维度特征指标向量输入到S6所述机器学习模型获取预测综合质量得分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学;杭州高新区(滨江)区块链与数据安全研究院,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励