浪潮云洲工业互联网有限公司王少华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮云洲工业互联网有限公司申请的专利医疗文本隐私信息抽取及加密方法、系统、终端及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120632126B 。
龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511127175.3,技术领域涉及:G06F16/36;该发明授权医疗文本隐私信息抽取及加密方法、系统、终端及介质是由王少华;唐旋;齐光鹏;武红强;谭新龙;刘恺悦设计研发完成,并于2025-08-13向国家知识产权局提交的专利申请。
本医疗文本隐私信息抽取及加密方法、系统、终端及介质在说明书摘要公布了:本发明涉及医疗数据管理领域,具体提供一种医疗文本隐私信息抽取及加密方法、系统、终端及介质,包括:使用自然语言处理技术从医疗文本中提取实体;将医疗文本和提取的实体输入预先训练的基于神经网络的关系抽取模型,获取各个实体之间的关系,生成实体关系三元组;根据敏感库和关联规则初步筛选出隐私候选集,利用隐私识别模型对候选集进行语义验证实现二次筛选,获得最终的隐私候选集;根据最终的隐私候选集中的实体,使用差分隐私技术对医疗文本中的对应实体添加噪声,生成噪声扰动的医疗文本;将最终的隐私候选集中的三元组进行同态加密后保存。本发明提升隐私识别准确率,降低误报率。
本发明授权医疗文本隐私信息抽取及加密方法、系统、终端及介质在权利要求书中公布了:1.一种医疗文本隐私信息抽取及加密方法,其特征在于,包括以下步骤: 获取待处理的医疗文本,使用自然语言处理技术从医疗文本中提取实体,包括:对待处理的医疗文本进行预处理,包括去除噪声字符,统一文本格式,根据医疗领域特点定制的停用词表过滤通用停用词,保留领域关键词;利用自然语言处理技术对预处理后的医疗文本进行分词,将连续文本分割为独立的词汇单元,并对每个词汇单元进行词性标注;采用基于深度学习的命名实体识别模型,从分词和词性标注后的文本中识别医疗领域的实体;对识别出的实体进行后处理,包括合并拆分错误的多词实体,去除重复或低置信度的实体;生成实体集合,包括每个实体的文本内容、类型以及在原文中的位置信息; 将医疗文本和提取的实体输入预先训练的基于神经网络的关系抽取模型,获取各个实体之间的关系,生成实体关系三元组; 根据预先配置的医疗领域隐私敏感库和关联规则,初步筛选出隐私候选集,并利用预训练的隐私识别模型对候选集进行语义验证实现二次筛选,获得最终的隐私候选集,隐私候选集中的元素为实体或三元组; 根据最终的隐私候选集中的实体,使用差分隐私技术对医疗文本中的对应实体添加噪声,生成噪声扰动的医疗文本; 将最终的隐私候选集中的三元组进行同态加密后保存; 其中,根据预先配置的医疗领域隐私敏感库和关联规则,初步筛选出隐私候选集,具体包括: 加载预定义的医疗领域隐私敏感库,该敏感库内包含敏感实体类型列表、敏感关键词表、敏感模式规则; 遍历输入的实体集合,对每个实体执行判断,包括检查实体类型是否属于隐私敏感库中的敏感实体类型,验证实体文本内容是否完全或部分匹配敏感关键词表,对符合特定类型的实体应用正则表达式验证; 满足任一判断条件的实体被标记为隐私候选实体; 分析输入的实体关系三元组,应用关联规则进行隐私判断,包括:加载预定义的敏感关系模式库,包含医疗隐私关系组合,对每个三元组进行模式匹配,判断其是否满足敏感关系模式,满足敏感关系模式的三元组被标记为隐私候选三元组; 其中,利用预训练的隐私识别模型对候选集进行语义验证实现二次筛选,获得最终的隐私候选集,具体包括: 接收初步筛选生成的隐私候选集,为每个候选元素构建完整的上下文表示,提取包含目标元素的文本片段及周边上下文窗口,并对文本片段进行标准化处理; 对候选隐私实体执行验证流程,包括:将实体及其上下文输入预训练的序列标注模型,获取模型输出的实体类型概率分布及边界标记,验证实体边界的连贯性和类型一致性,计算实体识别置信度得分,与预设阈值比较判断是否保留; 对候选隐私关系三元组执行验证流程,包括:将完整三元组及其上下文输入预训练的关系分类模型,获取模型输出的关系类型概率分布,验证关系语义的合理性和上下文一致性,计算关系分类置信度得分,应用动态阈值策略进行筛选。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮云洲工业互联网有限公司,其通讯地址为:250000 山东省济南市高新区浪潮路1036号浪潮科技园S02号楼19层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励