北京智谱华章科技有限公司林铄浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京智谱华章科技有限公司申请的专利一种基于主客观词表的英语推文命名实体提取方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116127971B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211458427.7,技术领域涉及:G06F40/295;该发明授权一种基于主客观词表的英语推文命名实体提取方法及设备是由林铄浩;高云鹏;高鑫;霍朦雨;万怀宇设计研发完成,并于2022-11-21向国家知识产权局提交的专利申请。
本一种基于主客观词表的英语推文命名实体提取方法及设备在说明书摘要公布了:本发明涉及一种基于主客观词表的英语推文命名实体提取方法及设备,属于数据处理技术领域;解决了英语推文中存在大量主观词影响后续命名实体识别性能的问题;本发明的命名实体提取方法包括以下步骤:获取多个领域的英文文本,构建语料库;对语料库中的文本进行分词和词频统计,并通过筛选,构建得到主观词表;对待识别英语推文进行预处理,得到标准推文文本;利用语法依存分析模型提取标准推文文本中的所有名词短语,基于主观词表对名词短语进行预处理,构建得到名词短语集合NPp;基于名词短语集合NPp中的名词短语构建树形父子级结构并进行命名实体提取,得到英语推文的命名实体识别结果。
本发明授权一种基于主客观词表的英语推文命名实体提取方法及设备在权利要求书中公布了:1.一种基于主客观词表的英语推文命名实体提取方法,其特征在于,包括以下步骤: 获取多个领域的英文文本,构建语料库; 对所述语料库中的文本进行分词和词频统计,并通过筛选,构建得到主观词表; 对待识别英语推文进行预处理,得到标准推文文本; 利用语法依存分析模型提取所述标准推文文本中的所有名词短语及名词性从句,基于所述主观词表对所述名词短语及名词性从句进行预处理,构建得到集合NPp; 基于所述集合NPp中的名词短语及名词性从句构建树形父子级结构并进行命名实体提取,得到所述英语推文的命名实体识别结果; 所述构建树形父子级结构并进行命名实体提取,包括: 基于所述集合NPp中的名词短语及名词性从句的包含关系,以包含至少一个名词短语的名词短语或名词性从句为父串,所述父串所包含的名词短语为子串,构建树形父子级结构; 基于各父串的名词所有格结构,提取其核心名词,并保存至命名实体集合 移除各父串中的所有子串,将剩余内容合并为新的字符串所有子串形成的集合记为cp; 若所述字符串满足对应的预设条件,将字符串保存至命名实体集合否则,基于所述字符串重新利用语法依存分析模型提取所有名词短语及名词性从句,并将提取得到的名词短语及名词性从句保存至命名实体集合将子串集合cp并入命名实体集合中,重新构建树形父子级结构进行命名实体提取,得到命名实体识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京智谱华章科技有限公司,其通讯地址为:100084 北京市海淀区中关村东路1号院8号楼五层B501;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。