Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 广东电网有限责任公司;广东电网有限责任公司信息中心周昉昉获国家专利权

广东电网有限责任公司;广东电网有限责任公司信息中心周昉昉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉广东电网有限责任公司;广东电网有限责任公司信息中心申请的专利一种基于自然语言处理的结构化数据生成模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118940719B

龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410854943.4,技术领域涉及:G06F40/151;该发明授权一种基于自然语言处理的结构化数据生成模型是由周昉昉;梁盈威;朱泰鹏;杨雨飞设计研发完成,并于2024-06-28向国家知识产权局提交的专利申请。

一种基于自然语言处理的结构化数据生成模型在说明书摘要公布了:本发明公开了一种基于自然语言处理的结构化数据生成模型,用于解决现有技术存在语义理解的局限性、语言多样性问题、数据偏差与不公平性、可解释性不足等问题;包括关键字提取模块、相似度对比模块、评分模块、文本预处理模块、识别处理模块、可信度判定模块和报告生成模块,本发明借助语言模型和神经网络技术对信息进行智能化、针对性处理,实现了复杂数据的结构化,实现具体工作环境中对大数据的智能处理和需求分析,同时减少了人工在机械重复劳动中浪费的时间成本同时也降低了人工失误造成的法律风险,解决了重复劳动的低效问题。

本发明授权一种基于自然语言处理的结构化数据生成模型在权利要求书中公布了:1.一种基于自然语言处理的结构化数据生成模型,包括关键字提取模块、相似度对比模块、评分模块、文本预处理模块、识别处理模块、可信度判定模块和报告生成模块,其特征在于: 关键字提取模块对商务子系统收到的文档进行分类,使用BERT语言模型对整篇文档进行识别,在文档中捕捉类型判断元素来判断文档类型; 使用BERT语言模型对整篇文档进行识别,在文档中捕捉类型判断元素,记录在整篇文档中的各种类型判断元素出现频率,每个类型判断元素对应一个预设的判断权重,通过计算得到类型判断参数的数值并确定文档类型;每个文档类型使用对应的正则表达式将文档中的关键字进行提取,将关键字组成数据向量,生成结构化数据; 相似度对比模块将有相同文档类型的文档互相进行全文比较来标记差异字符,基于对差异字符的特性分析得到差异评分并将差异评分大于阈值的字符进行高亮显示; 将有相同文档类型的文档互相进行全文比较,将比较相似段落中语义有差异的文字标记为差异字符,使用BERT语言模型分析差异字符的意义并匹配一个参考字符,生成差异字符的意义向量和参考字符的意义向量;分析差异字符的词性获取预设的词性因子;分析差异文字的所处位置获取对应的位置因子;分析差异文字的上下文和所处语境获取一个上下文因子,通过运算得到差异评分,将差异评分大于预设阈值的差异字符进行高亮显示,并将差异评分加入数据向量本身; 评分模块基于关键字和差异评分对文档质量进行评分,然后将商务子系统的所有数据生成结构化数据并发送给数据库; 文本预处理模块将客服平台子系统收到的客服反馈信息进行汉字拆分、敏感信息加密和无用信息的屏蔽; 识别处理模块基于语言模型量化客服反馈信息中的可信度指数; 可信度判定模块通过对可信度指数计算得到客服反馈信息的可信度指数,综合加密投送人姓名、投送时间、客服反馈信息原文和可信度指数后,生成客服反馈信息的数据向量并发送给报告生成模块; 报告生成模块提取客服反馈信息原文中的关键字并针对所述原文生成数据报告,然后将客服平台子系统的所有数据生成结构化数据发送给数据库。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东电网有限责任公司;广东电网有限责任公司信息中心,其通讯地址为:510060 广东省广州市越秀区东风东路757号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。