Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川大学华西医院陈蕾获国家专利权

四川大学华西医院陈蕾获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川大学华西医院申请的专利一种语料库构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121122547B

龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511643002.7,技术领域涉及:G16H10/60;该发明授权一种语料库构建方法及系统是由陈蕾;金灵;何孟桥;巴桑斯甲设计研发完成,并于2025-11-11向国家知识产权局提交的专利申请。

一种语料库构建方法及系统在说明书摘要公布了:本申请涉及一种语料库构建方法及系统,所述方法包括依据癫痫临床特征建立多维标注体系,并为不同类别的标签分配差异化标注策略;获取癫痫相关的原始临床文本数据,利用差异化标注策略对原始临床文本数据进行标注,形成带标签的标注语料;对获得的带标签的标注语料进行一致性评估,并在一致性低于预设阈值时迭代修订标注规则,直至一致性达标;以带标签的标注语料作为监督信号进行实体识别模型的训练与验证,得到面向癫痫临床文本的实体识别模型;将训练后的实体识别模型应用于未标注的癫痫临床文本,生成结构化语料库。本申请能够解决目前的方法抽取精度低、粒度粗以及适应性差等问题,该方法兼顾精准与召回,能够输出高质量带标签语料库。

本发明授权一种语料库构建方法及系统在权利要求书中公布了:1.一种语料库构建方法,其特征在于,包括以下步骤: S1:依据癫痫临床特征建立多维标注体系,并为不同类别的标签分配差异化标注策略;所述多维标注体系包括以下至少两种一级标签类别:疾病、病程阶段时间、临床表现、医疗检查、治疗、药物及影响因素,并在一级标签类别下设置具有临床语义的二级标签类别或三级标签类别; 所述差异化标注策略包括: 为每个标签类别预设优先级权重,以使高临床价值标签在冲突时优先保留,包括: 按临床价值将标签类别划分为高、中、低三级,并对应赋予高、中、低权重; 在标签冲突时,按权重高低即时裁决,高权重标签优先保留,低权重标签被抑制或降级为候选,包括: 通过预训练的置信度模型获取每个标签类别的置信度; 根据标签类别的优先级层级设置分层置信度管理策略,包括: 为高优先级标签设置强制保留的第一置信度阈值,以确保临床核心信息优先输出; 为中优先级标签设置候选或者保留的第二置信度阈值,并为低优先级标签设置抑制输出的第三置信度阈值; 为每个标签类别设定对应的识别区间及嵌套允许度,以控制扫描窗口与上下文融合范围; 为每个标签类别设定精准度等级,以限定在文本中的标注粒度; S2:获取癫痫相关的原始临床文本数据,利用步骤S1中的差异化标注策略对原始临床文本数据进行标注,形成带标签的标注语料; S3:对步骤S2获得的带标签的标注语料进行一致性评估,并在一致性低于预设阈值时迭代修订标注规则,直至一致性达标; S4:以带标签的标注语料作为监督信号进行实体识别模型的训练与验证,得到面向癫痫临床文本的实体识别模型; S5:将训练后的实体识别模型应用于未标注的癫痫临床文本,生成结构化语料库。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学华西医院,其通讯地址为:610041 四川省成都市武侯区国学巷37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。