上海大智慧信息科技有限公司陈瑞清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海大智慧信息科技有限公司申请的专利选股条件拆分与改写方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120929594B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511460852.3,技术领域涉及:G06F16/335;该发明授权选股条件拆分与改写方法及系统是由陈瑞清;于青峰;殷维设计研发完成,并于2025-10-14向国家知识产权局提交的专利申请。
本选股条件拆分与改写方法及系统在说明书摘要公布了:本发明提供了一种选股条件拆分与改写方法及系统,包括:步骤S1:获取只包含用户问句的文本T,并对获取的文本T进行预处理,预处理后的文本T基于选股因子库F得到与文本T相似度满足预设要求的因子集合J,从而得到标注数据集;步骤S2:对标注数据集按照预设要求进行扩充,得到扩充标注数据集;步骤S3:将标注数据集与扩充标注数据集进行合并,并对合并的标注数据集进行预处理,得到预处理后的标注数据集;步骤S4:利用预处理后的标注数据集对改写模型进行训练,得到训练后改写模型,利用训练后的改写模型对选股条件进行拆分与改写;所述改写模型是基于qwen模型对用户问句文本根据选股因子库进行拆分与改写。
本发明授权选股条件拆分与改写方法及系统在权利要求书中公布了:1.一种选股条件拆分与改写方法,其特征在于,包括: 步骤S1:获取只包含用户问句的文本T,并对获取的文本T进行预处理,预处理后的文本T基于选股因子库F得到与文本T相似度满足预设要求的因子集合J,从而得到标注数据集; 步骤S2:对标注数据集按照预设要求进行扩充,得到扩充标注数据集; 步骤S3:将标注数据集与扩充标注数据集进行合并,并对合并的标注数据集进行预处理,得到预处理后的标注数据集; 步骤S4:利用预处理后的标注数据集对改写模型进行训练,得到训练后改写模型,利用训练后的改写模型对选股条件进行拆分与改写; 所述改写模型是基于qwen模型对用户问句文本根据选股因子库进行拆分与改写; 所述步骤S1包括: 步骤S1.1:从选股系统的线上日志中导出每条交互记录R,对导出的每条交互记录R进行清洗预处理,并提取只包含用户问句的文本T; 步骤S1.2:对文本T进行包括分句、去停用词以及句向量编码预处理,得到预处理后的文本T; 步骤S1.3:基于选股因子库F,通过向量检索或基于预设规则的召回方法,得到与预处理后的文本T相关的因子候选集合S; 步骤S1.4:将文本T与因子候选集合S输入大语言模型,以使大语言模型从因子候选集合S中筛选出与文本T相似度满足预设要求的因子集合J,得到标注数据集; 所述步骤S2包括: 步骤S2.1:获取标注数据集中包含多个因子的标注问句集合M; 步骤S2.2:将选股因子库F划分为带参数因子集合A和不带参数因子集合B; 步骤S2.3:基于带参数因子集合A对标注问句集合M进行扩充; 步骤S2.4:基于不带参数因子集合B对标注问句集合M进行扩充; 步骤S2.5:根据实际应用场景对问句进行扩充,并生成相应标签; 所述步骤S2.3包括: 步骤S2.3.1:基于带参数因子集合A选择带参数因子P; 步骤S2.3.2:从标注问句集合M中随机采样并结合带参数因子P,通过大语言模型生成符合标注问句集合M风格的融合句子,并生成对应的结构化标注; 步骤S2.3.3:根据预设规则对带参数因子P进行参数替换生成规则化句子,并自动生成标注; 步骤S2.3.4:规则扩充得到的句子通过大语言模型生成相似句,并自动生成标注; 所述步骤S2.4包括: 步骤S2.4.1:基于不带参数因子集合B选择不带参数因子N; 步骤S2.4.2:对不带参数因子N使用大语言模型进行相似短句扩充并自动生成标注; 所述步骤S3包括:将标注数据集和扩充的标注数据集按照预设比例进行合并,并对合并的数据集进行包括去重以及满足预设要求的敏感样本过采样处理,得到预处理后的标注数据集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海大智慧信息科技有限公司,其通讯地址为:200120 上海市浦东新区自由贸易试验区杨高南路428号1幢9层(名义层, 实际层8层);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励