江苏跨网智能科技有限公司付磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏跨网智能科技有限公司申请的专利一种以蝶形控制架构为中心的文档关联分析检索系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117171415B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311157455.X,技术领域涉及:G06F16/93;该发明授权一种以蝶形控制架构为中心的文档关联分析检索系统是由付磊;袁涛;杨安康设计研发完成,并于2023-09-08向国家知识产权局提交的专利申请。
本一种以蝶形控制架构为中心的文档关联分析检索系统在说明书摘要公布了:本发明公开了一种以蝶形控制架构为中心的文档关联分析检索系统,包括用于对文档的矢量化数值进行关联化处的矢量关联化处理单元,用于处理用户输入的检索信息并反馈检索结果的检索信息和反馈单元,统一存储数据的数据库池;检索信息和反馈单设有蝶形控制模块和矢量检索模块,系统通过蝶形控制模块进行蝶形控制,可根据用户比较模糊的自然语言检索表述,快速精确地定位到海量企业内部文档的某个段落,并能用复合用户理解的自然语言进行重组后,反馈给用户。本发明可解决用户表述不清等问题,可根据用户的表述及访问权限对内部文档进行重新组织,适应用户的理解能力,为用户提供与本身理解配合的表述形式,提升文档的利用效率与信息检索安全性。
本发明授权一种以蝶形控制架构为中心的文档关联分析检索系统在权利要求书中公布了:1.一种以蝶形控制架构为中心的文档关联分析检索系统,其特征在于:系统包括矢量关联化处理单元、检索信息和反馈单元、数据库池; 所述矢量关联化处理单元,用于对文档的矢量化数值进行关联化处理;所述矢量关联化处理单元包括多模态信息筛选模块、矢量化模块和网格化关联模块;所述多模态信息筛选模块,从连接的网络中自动获取各个待关联分析的运营管理文档,对所述运营管理文档进行分级分类,将文档中的信息拆分为文本、图片和表格三个主体元素,文本、图片作为非结构化信息,表格作为结构化信息;所述矢量化模块,将拆分得到的非结构化信息计算成为对应的矢量信息,将计算得到矢量信息存储到矢量数据库中,便于后续进行矢量化计算用;所述网格化关联模块,用于将所述矢量信息与所述结构化信息进行关联计算,得到对应的多维的关联矩阵,这样所有文档中的信息元素之间都存在一个多维的关联矩阵,从而进行量化分析与检索;对于文本,采用sentence2vec算法,以句子为单元,将句子进行矢量化;对于图片,将文档中对于该图片的描述文字进行矢量化计算,如果在文档中找不到明确的描述文字,就丢弃该图片,不做处理;所述关联矩阵是将文本、图片、表格都以段落距离为衡量进行关联,同时还采用语义与关键词的关联,从而形成多维度关联; 所述检索信息和反馈单元,用于对用户输入的检索信息进行处理,以及将检索结果反馈给用户;该单元包括蝶形控制模块和矢量检索模块,其中:所述蝶形控制模块,用于将用户输入的信息分析处理成检索自然语言并传输给矢量检索模块,也用于把检索结果反馈给用户;所述矢量检索模块,用于将蝶形控制模块中输出的检索自然语言转为矢量检索命令,根据矢量检索命令在数据库池中进行检索,根据对应的关联矩阵获得检索结果,并把检索结果反馈给蝶形控制模块; 所述蝶形控制模块包含上下文分析子模块、多模态渲染子模块、多模态混合子模块和检索合成子模块; 所述上下文分析子模块,用于处理用户输入的信息,分析用户输入信息的描述过程,保存用户的上下文信息和处理分析后的上下文信息,将这两种上下文信息混合汇总为一个长文本信息,供多模态渲染子模块和多模态混合子模块使用; 所述多模态渲染子模块,用于将上下文分析子模块生成的长文本信息进行渲染,然后生成复合检索命令发送给检索合成子模块;还用于将多模态混合子模块处理后的复合检索结果进行渲染,并对关键数据进行判定纠正后,形成多媒体页面信息,反馈给用户; 所述检索合成子模块,用于将复合检索命令中的提示语进行合成,形成新的检索命令,所述新的检索命令包含有非结构化语言和或结构化语言,系统通过调用矢量检索模块获取新的检索命令; 所述多模态混合子模块,用于接收矢量检索模块反馈的检索结果,然后生成复合检索结果,并将复合检索结果发给多模态渲染子模块;所述复合检索结果包含有图片与表格原始文件信息;所述复合检索结果包含蝶形控制模块内部的检索信息与控制信息,所述检索信息与控制信息每次经过多模态混合子模块则会被重新组织一次; 所述数据库池,包括统一数据池接口模块和若干数据库,形成统一的数据库池;所述统一数据池接口模块用于提供统一的接口,关联到多个数据库;所述若干数据库,至少包括结构化数据库、非结构化数据库、矢量数据库、文件信息数据库、文件中段落信息数据库、图片信息数据库、表格检索表数据库,用于存储各类数据,所有数据都从该数据库池中进行读取。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏跨网智能科技有限公司,其通讯地址为:211106 江苏省南京市江宁区秣陵街道庄排路159号1幢201-3室(江宁开发区);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励