青岛无量科技有限公司包琳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉青岛无量科技有限公司申请的专利互联网大数据提取方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120632187B 。
龙图腾网通过国家知识产权局官网在2025-12-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510809252.7,技术领域涉及:G06F16/953;该发明授权互联网大数据提取方法、装置、设备及存储介质是由包琳设计研发完成,并于2025-06-17向国家知识产权局提交的专利申请。
本互联网大数据提取方法、装置、设备及存储介质在说明书摘要公布了:本发明涉及一种互联网大数据提取方法、装置、设备及存储介质,包括以下步骤,对互联网数据源进行分布式爬虫采集,获得原始网络数据,并将其转换为结构化数据矩阵。通过对矩阵进行多层次语义解析,构建语义特征图谱,并进行主题分割与归类,形成主题域知识树。进一步挖掘知识树中的关联规则,构建隐含知识网络。基于该网络对查询条件进行语义分解与扩展,生成扩展查询数据,并与知识网络进行相似度匹配,获得候选数据集。最后对候选数据进行多因素排序与提取,输出目标数据,解决了在二手车市场中,由于数据来源广泛及语义模糊,导致现有系统在进行价格预测及维修成本分析时存在较大的偏差的技术问题。
本发明授权互联网大数据提取方法、装置、设备及存储介质在权利要求书中公布了:1.一种互联网大数据提取方法,其特征在于,包括以下步骤: 对互联网数据源进行分布式爬虫采集,得到原始网络数据集,并对所述原始网络数据集进行异构数据结构化转换,得到结构化数据矩阵; 对所述结构化数据矩阵进行多层次语义解析,得到语义特征图谱; 对所述语义特征图谱进行主题分割与归类,得到主题域知识树,并对所述主题域知识树进行关联规则挖掘,得到隐含知识网络; 基于所述隐含知识网络对预设的查询条件进行语义分解与扩展,得到查询扩展数据; 将所述查询扩展数据与所述隐含知识网络进行相似度计算,得到候选数据集; 对所述候选数据集进行多因素综合排序及提取,得到目标提取数据; 其中,所述对所述语义特征图谱进行主题分割与归类,得到主题域知识树,包括: 对所述语义特征图谱中的高维语义节点进行局部邻域拓扑构建,得到邻接相似度矩阵,并对所述邻接相似度矩阵进行基于谱分析的特征子空间分解,得到低秩嵌入向量场; 基于所述低秩嵌入向量场对所述高维语义节点进行动态密度感知划分,得到初始聚类种子簇,并对所述初始聚类种子簇进行自适应扩散融合操作,得到多层级语义凝聚结构; 对所述多层级语义凝聚结构中的语义区域进行主题判别函数计算,得到主题归属概率分布,并基于所述主题归属概率分布对所述语义区域进行层次化主题标签传播,得到初步主题域层级映射;其中,所述初步主题域层级映射包括顶层抽象主题、中层分类主题和底层细粒度主题标签; 基于所述初步主题域层级映射对所述语义特征图谱进行主题结构优化,得到主题域知识树; 所述对所述主题域知识树进行关联规则挖掘,得到隐含知识网络,包括: 对所述主题域知识树中的分支主题节点进行基于信息熵增的上下文共现模式提取,得到高频语义共现序列,并基于条件随机场对所述高频语义共现序列进行概率依赖建模,得到语义依赖概率图; 基于所述语义依赖概率图对所述主题域知识树中的叶级具体主题实例进行多粒度路径采样,得到主题演化路径集合,并对所述主题演化路径集合进行知识流传播建模,得到主题间因果传导权重矩阵; 基于最大似然估计方法对所述因果传导权重矩阵进行规则置信度计算,得到潜在关联规则集,并基于所述潜在关联规则集对所述主题域知识树中的根主题节点进行双向推理链构建,得到跨域知识推理路径; 基于所述跨域知识推理路径对所述主题域知识树进行知识实体映射扩展,得到隐含知识网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人青岛无量科技有限公司,其通讯地址为:266000 山东省青岛市崂山区苗岭路52号巨峰创业大厦120A;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励