Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜深圳市智慧城市科技发展集团有限公司朱润酥获国家专利权

恭喜深圳市智慧城市科技发展集团有限公司朱润酥获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜深圳市智慧城市科技发展集团有限公司申请的专利基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119988713B

龙图腾网通过国家知识产权局官网在2025-06-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510466015.5,技术领域涉及:G06F16/953;该发明授权基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品是由朱润酥;郑德生;刘林鹏设计研发完成,并于2025-04-15向国家知识产权局提交的专利申请。

基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品在说明书摘要公布了:本申请公开了一种基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品,涉及数据处理技术领域。上述方法通过接收用户输入的搜索指令,将搜索指令输入训练好的语义解析模型,在语义解析模型将搜索指令转换为查询参数后,将查询参数发送至搜索引擎,然后,接收搜索引擎根据查询参数获取的网页,并根据预设筛选规则从网页中确定目标网页,基于预先获取的授权结果,爬取目标网页的HTML源代码,将HTML源代码输入训练好的LLM模型,在LLM模型根据HTML源代码确定目标代码标签后,得到目标代码标签内的文本内容。其中,LLM模型具备强大的语言理解能力,可以动态适应网页结构的变化,降低了爬取网页内容的时间成本。

本发明授权基于LLM实现智能AI获取网页内容的方法、设备、存储介质及程序产品在权利要求书中公布了:1.一种基于LLM实现智能AI获取网页内容的方法,其特征在于,所述方法包括: 接收用户输入的搜索指令,将所述搜索指令输入训练好的语义解析模型,在所述语义解析模型将所述搜索指令转换为查询参数后,将所述查询参数发送至搜索引擎; 接收所述搜索引擎根据所述查询参数获取的网页,并根据预设筛选规则从所述网页中确定目标网页; 基于预先获取的授权结果,爬取所述目标网页的HTML源代码,将所述HTML源代码输入训练好的LLM模型,其中,所述LLM模型接收所述HTML源代码,将所述HTML源代码解析为DOM树,并根据所述DOM树构建标签关系图数据,所述标签关系图数据中的节点表示DOM树中的标签,边表示所述标签之间的父子关系、兄弟关系或其他自定义关系,为所述DOM树中每个标签节点分配簇标识,计算每对簇之间的相似度或距离,选择相似度最高或距离最小的簇对进行合并,计算合并形成的标签层次聚类数据的内部簇紧密度,当合并后的簇的内部紧密度达到或超过预设的阈值时,停止合并,根据所述标签关系图数据和所述标签层次聚类数据,于预设知识库中进行匹配,确定所述目标网页的网页类型,根据所述预设知识库,确定所述网页类型对应的有效代码标签,基于所述有效代码标签,在所述DOM树中确定目标代码标签; 遍历所述DOM树中目标代码标签节点的子节点,访问所述子节点的节点类型属性; 若所述子节点的节点类型属性为文本节点,则提取所述子节点对应的文本内容。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市智慧城市科技发展集团有限公司,其通讯地址为:518000 广东省深圳市福田区华富街道莲花一村社区皇岗路5001号深业上城(南区)T1栋12层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。