北京星河智源科技有限公司;北京星河智源信息技术有限公司徐青伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京星河智源科技有限公司;北京星河智源信息技术有限公司申请的专利一种个性化科技知识问答方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120633832B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510674559.0,技术领域涉及:G06N5/04;该发明授权一种个性化科技知识问答方法及系统是由徐青伟;钟百敏;严长春;裴非;范娥媚设计研发完成,并于2025-05-23向国家知识产权局提交的专利申请。
本一种个性化科技知识问答方法及系统在说明书摘要公布了:本申请公开了一种个性化科技知识问答方法及系统,方法首先获取并处理科技文献数据,构建领域基础模型训练语料进行继续预训练,形成领域基础模型。接着以领域基础模型为基础,初始化采样模型的参数,利用种子数据进行初始训练,并通过多轮迭代的强化学习训练采样模型,生成样本数据。然后以领域基础模型为基础,初始化问答模型的参数,使用采样模型生成的样本数据构建蒸馏训练数据集,并进行有监督微调训练,直至模型收敛。最后,将训练好的问答模型封装成在线推理接口服务,构建科技知识问答系统。本申请实现了针对用户个性化需求的科技知识问答服务,显著提高了问题解答的效率和精确性。
本发明授权一种个性化科技知识问答方法及系统在权利要求书中公布了:1.一种个性化科技知识问答方法,其特征在于,所述方法包括领域基础模型构建、采样模型训练、问答模型训练和问答系统构建四个步骤,其具体包括: 领域基础模型构建:获取并处理科技文献数据,构建领域基础模型训练语料,基于开源预训练模型,使用所述训练语料进行继续预训练,构建领域基础模型; 采样模型训练:以领域基础模型为基础,初始化采样模型的参数,使用种子数据对采样模型进行初始训练,通过多轮迭代的强化学习训练采样模型,生成样本数据; 问答模型训练:以领域基础模型为基础,初始化问答模型的参数,使用采样模型生成的样本数据构建蒸馏训练数据集,对问答模型进行有监督微调训练,直至收敛; 问答系统构建:将训练好的问答模型封装成在线推理接口服务,构建科技知识问答系统,在问答系统使用过程中,将用户特征和会话历史输入问答模型,动态生成个性化的答案; 所述采样模型训练步骤中,所述种子数据包括用户信息和用户的历史检索数据,其中用户信息为用户开通账号时登记的用户名称、年龄、职业、单位、行业信息数据,历史检索数据包括用户查询、返回结果、用户通过点击或者浏览反馈信息数据; 所述采样模型训练步骤中,通过多轮迭代的强化学习训练采样模型包括:每轮迭代开始时通过领域基础模型参数进行初始化,使用当前采样模型对用户问题生成多个候选答案,结合规则验证和大模型评估对候选答案进行评分,并使用在线GRPO强化学习算法更新采样模型的参数; 使用在线GRPO强化学习算法更新采样模型的参数,具体包括通过公式: 进行训练,其中,θ为采样模型参数;q为查询输入,服从PQ分布;JGRPOθ为优化目标;G为样本分组数,取值为16;πθ为采样模型新策略;为采样模型旧策略;πref为参考模型策略,初始时为领域基础模型,后续迭代过程中为上轮采样模型;clip为剪切函数;oi为第i个样本输出;oi,t为第i个样本t时刻输出;oi,<t为第i个样本t时刻之前的输出;∈为是剪切范围超参数;β为KL散度权重系数;DKL为KL散度距离: 通过分组内部相对奖励值进行计算得到:为归一化奖励,ri为第i个样本的奖励,r表示所有样本上的奖励变量,meanr为变量r的均值,stdr为变量r的标准差。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京星河智源科技有限公司;北京星河智源信息技术有限公司,其通讯地址为:100089 北京市海淀区长春桥路11号3号、4号楼裙房四层401-1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励