Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京乐码仕智能科技有限公司李小保获国家专利权

北京乐码仕智能科技有限公司李小保获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京乐码仕智能科技有限公司申请的专利一种用于RAG系统的文本分割、查询方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119378534B

龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411942702.1,技术领域涉及:G06F40/205;该发明授权一种用于RAG系统的文本分割、查询方法及装置是由李小保;王晓婷;张侃;李沙;王福桥;吴贵虎设计研发完成,并于2024-12-27向国家知识产权局提交的专利申请。

一种用于RAG系统的文本分割、查询方法及装置在说明书摘要公布了:本申请公开了一种用于RAG系统的文本分割、查询方法及装置,涉及自然语言处理技术领域,该方法包括:接收目标文档;检测读取的当前待处理文本的文本类型;在检测到当前待处理文本为标题时,获取标题对应的标题级别;检测存储介质中上一次保存的数据项中的文本信息是否有数据;若文本信息中有数据,则将数据项存储于资源池中,清空数据项的文本信息以及标题信息中小于或等于标题级别的数据,将标题写入标题信息中的对应位置;若文本信息中没有数据,则将标题写入标题信息中的对应位置;在检测到当前待处理文本为正文时,将当前待处理文本存储于数据项中的正文信息的位置。本申请可提升答案的完整性和准确性。

本发明授权一种用于RAG系统的文本分割、查询方法及装置在权利要求书中公布了:1.一种用于RAG系统的文本分割方法,其特征在于,所述用于RAG系统的文本分割方法包括: 接收目标文档; 依次读取所述目标文档中的每一段待处理文本,并对所述每一段待处理文本执行如下文本存储步骤: 检测读取的当前待处理文本的文本类型,所述文本类型包括:标题或正文; 在检测到所述当前待处理文本为标题时,获取所述标题对应的标题级别; 检测存储介质中上一次保存的数据项中的文本信息是否有数据;所述数据项指示标题信息与文本信息的对应关系,每一条所述数据项中的所述标题信息为根据标题级别依次保存的标题,每一条所述数据项中的所述文本信息为对应的所述标题信息中级别最低的标题对应的文本; 若所述文本信息中有数据,则将所述数据项存储于资源池中,清空所述数据项的所述文本信息以及所述标题信息中小于或等于所述标题级别的数据,将所述标题写入所述标题信息中的对应位置,执行检测步骤; 若所述文本信息中没有数据,则将所述标题写入所述标题信息中的对应位置,执行所述检测步骤; 在检测到所述当前待处理文本为正文时,将所述当前待处理文本存储于所述数据项中的正文信息的位置,执行所述检测步骤; 所述检测步骤包括: 检测所述目标文档是否已读取完成,若未读取完成,对下一段待处理文本重新执行上述文本存储步骤,若已读取完成,则存储所述数据项至所述资源池中; 所述将所述数据项存储于资源池,包括: 检测所述数据项中的文本信息中的字符数是否大于预设字符数; 若大于所述预设字符数,则将所述文本信息中的字符根据预设数量划分为多个文本块; 根据所述文本块的数量将所述数据项划分为对应数量的多个子数据项,每个所述子数据项中包括:所述标题信息与当前文本块信息,所述当前文本块信息包括:当前文本块、所述文本块的总数、所述当前文本块的排序和上一个所述文本块最后的预设数量的字符;以在查询时,根据所述文本块的总数和所述当前文本块的排序检测查询到文本信息是否有缺失;若有,则根据所述标题信息、所述文本块的总数和所述当前文本块的排序查找缺失的信息; 将所述子数据项存储于所述资源池中; 若不大于所述预设字符数,将所述数据项存储于所述资源池。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京乐码仕智能科技有限公司,其通讯地址为:100160 北京市丰台区智成北街3号院3号楼-3至9层101内7层701室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。