Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中科凡语科技有限公司邓彪获国家专利权

北京中科凡语科技有限公司邓彪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中科凡语科技有限公司申请的专利一种中文分词的方法、装置和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116050406B

龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211691524.0,技术领域涉及:G06F40/289;该发明授权一种中文分词的方法、装置和存储介质是由邓彪;翟飞飞;史桂华设计研发完成,并于2022-12-27向国家知识产权局提交的专利申请。

一种中文分词的方法、装置和存储介质在说明书摘要公布了:本发明公开一种中文分词的方法、装置和存储介质,属于自然语言处理技术领域。该中文分词的方法,包括以下步骤:S1、获取待检测句子的第二语言译文句子;S2、使用中文Bert预训练语言模型对待检测句子进行编码,获取整个句子语义信息的向量表征和句子向量表征序列;S3、使用第二语言Bert预训练语言模型对译文句子进行编码,获取整个句子语义信息的向量表征;S4、融合待检测句子和译文句子语义特征,得到待检测句子的每个字的预测类别;S5、按照预测类别,对待检测句子切分,得到分词结果。该方法提高了分词的准确性,尤其对于外来词具有较好分词效果。

本发明授权一种中文分词的方法、装置和存储介质在权利要求书中公布了:1.一种中文分词的方法,其特征在于,包括以下步骤: S1、获取待检测句子的第二语言译文句子; S2、使用中文Bert预训练语言模型对待检测句子进行编码,获取整个句子语义信息的向量表征和句子向量表征序列; S3、使用第二语言Bert预训练语言模型对译文句子进行编码,获取整个句子语义信息的向量表征; S4、融合待检测句子和译文句子语义特征,得到待检测句子的每个字的预测类别; 在步骤S4中,所述预测类别由以下步骤得到: S41、将待检测句子文本的向量表征序列和译文句子的整体语义向量表征进行拼接,得到融合向量表征序列; S42、将所述融合向量表征序列作为编码端输入,送入BilSTM网络得到其隐层输出,得到预测标签的概率分布矩阵; S43、通过CRF层获得邻近标签之间的依赖关系,生成一个最优的预测序列,根据输出预测标签序列得到每个字的预测类别; 在步骤S43中,根据输出预测标签序列得到每个字的预测类别之前,还包括对于句子属于某个预测类别进行打分: 其中,A是k+2×k+2为转移分数矩阵,P为发射矩阵,代表标签yi转移为yi+1的分数,表示字符i的第yi个标签的分数; 利用Softmax得到归一化后,句子X的标签等于Y的概率: 其中,表示整个序列中句子X等于某一标签的打分,YX表示所有可能的标签序列;模型训练时通过最大化对数似然函数实现,采用最大似然估计求解PY|X的最大后验概率: S5、按照预测类别,对待检测句子切分,得到分词结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科凡语科技有限公司,其通讯地址为:100190 北京市海淀区知春路63号51号楼10层1006;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。