Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京易联阳光信息技术股份有限公司朱礼伟获国家专利权

南京易联阳光信息技术股份有限公司朱礼伟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京易联阳光信息技术股份有限公司申请的专利深度NLP模型用于医药文档关键信息提取的系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119988646B

龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510458700.3,技术领域涉及:G06F16/36;该发明授权深度NLP模型用于医药文档关键信息提取的系统及方法是由朱礼伟;单大伟;虞真珍设计研发完成,并于2025-04-14向国家知识产权局提交的专利申请。

深度NLP模型用于医药文档关键信息提取的系统及方法在说明书摘要公布了:本发明公开了深度NLP模型用于医药文档关键信息提取的系统及方法,涉及自然语言处理技术领域,本方法包括以下步骤:收集多源数据,清洗噪声并依标准术语库对齐,构建原始语料库、标准化实体词典以及关键信息本体库;用预训练模型BioBERT对标注数据集适配调整,根据任务训练多任务NLP模型,基于高频术语优化模型权重;以优化模型处理新文档,经阈值过滤、聚类分析,专家验证后更新本体库,补充新术语及标注;混合新旧标注数据,用EWC算法增量更新模型;解析新文档,构建动态医药知识图谱。本发明能够有效改善现有技术中领域新知识和新术语无法快速纳入模型导致模型难以及时更新的情况。

本发明授权深度NLP模型用于医药文档关键信息提取的系统及方法在权利要求书中公布了:1.深度NLP模型用于医药文档关键信息提取的方法,其特征在于:该方法包括以下步骤: 步骤1、收集多源数据,清洗噪声并依标准术语库对齐,构建原始语料库、标准化实体词典以及关键信息本体库; 步骤2、用预训练模型BioBERT对标注数据集适配调整,根据任务训练多任务NLP模型,基于高频术语优化模型权重; 步骤3、以优化模型处理新文档,经阈值过滤、聚类分析,专家验证后更新本体库,补充新术语及标注; 步骤4、混合新旧标注数据,用EWC算法增量更新模型;解析新文档,构建动态医药知识图谱; 在步骤1中,采集非结构化医药文档,包括说明书、报告和文献; 对于原始文档,清洗噪声,得到原始语料库; 对于原始语料库中的非标准术语,使用标准术语库对齐,得到标准化实体词典; 对于标准化词典和原始语料库,通过专家标注定义实体、关系及属性,得到结构化关键信息本体库; 整合公开数据集以及专家标注数据形成标注数据集; 在步骤2中,对于标注数据集,使用预训练模型BioBERT进行领域适配调整,得到优化的文本编码器; 使用优化的文本编码器对标注数据集进行编码; 对于编码后的文本,通过CRF、多头注意力、问答解码器联合训练,得到多任务NLP模型; 对于多任务NLP模型注意力分布,基于标准化词典中的高频术语增强权重,得到优化后的NLP模型; 在步骤3中,使用优化后的NLP模型处理新文档,对于模型预测结果,基于预设阈值过滤,得到潜在新信息候选集; 对于新信息候选集的上下文,使用Sentence-BERT模型将文本转化为语义向量,然后采用K-means聚类算法对语义向量进行聚类得到语义分组;对语义分组进行聚类操作,得到新术语候选; 对于聚类结果,通过专家平台验证,得到更新后的本体库,包括新增术语及标注数据; 在步骤4中,对于标注数据集以及新增标注数据,使用数据回放进行混合,得到平衡数据集; 对于优化后的NLP模型参数,使用弹性权重固化算法,保护优化后的NLP模型在标注数据集中学到的实体、关系以及属性,得到增量更新后的NLP模型; 对于上传的新文档,使用LayoutLM解析,得到结构化文本或表格数据; 对于解析后的文本,使用增量更新后的模型,得到实体、关系或属性结果; 对于提取到的结果,使用Neo4j构建图谱,得到动态更新的医药知识图谱。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京易联阳光信息技术股份有限公司,其通讯地址为:210000 江苏省南京市秦淮区洪武路23号401室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。