中电数据产业集团有限公司;中电数创(北京)科技有限公司陆志鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中电数据产业集团有限公司;中电数创(北京)科技有限公司申请的专利文本的信息量评估方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119849494B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411922210.6,技术领域涉及:G06F40/284;该发明授权文本的信息量评估方法、装置、设备及介质是由陆志鹏;韩光;符兴斌;郑曦;国丽;周崇毅;杨伟伟;郭红刚;王欢;唐超;沈逸凡设计研发完成,并于2024-12-25向国家知识产权局提交的专利申请。
本文本的信息量评估方法、装置、设备及介质在说明书摘要公布了:本公开涉及一种文本的信息量评估方法、装置、设备及介质,该方法包括:获取待评估的目标文本;确定目标文本中每个分词文本的出现概率,并基于各分词文本的出现概率确定目标文本的原始信息熵;基于目标文本的文本长度和修正系数,对原始信息熵进行修正,得到目标信息熵;根据预先确定的评估阈值对目标信息熵进行标准化。本公开能够提高信息量评估的计算效率和准确性。
本发明授权文本的信息量评估方法、装置、设备及介质在权利要求书中公布了:1.一种文本的信息量评估方法,其特征在于,包括: 获取待评估的目标文本; 确定所述目标文本中每个分词文本的出现概率,并基于各所述分词文本的出现概率确定所述目标文本的原始信息熵; 基于所述目标文本的文本长度和修正系数,对所述原始信息熵进行修正,得到目标信息熵; 根据预先确定的评估阈值对所述目标信息熵进行标准化; 所述评估阈值的确定过程包括: 获取多个文本样本的样本信息熵; 确定所述样本信息熵的分布特征;其中,所述分布特征包括:所述样本信息熵的偏度、峰度和正态性检验结果; 根据所述分布特征确定所述样本信息熵符合的多种分布类型; 分别使用多种所述分布类型的概率分布拟合函数对所述样本信息熵进行数据拟合,得到多种拟合结果; 使用P-P图和Q-Q图对各所述拟合结果进行检验,以在多种概率分布函数中确定目标概率分布函数及其对应的目标拟合结果; 根据所述目标拟合结果和不同的统计算法分别确定多种候选阈值;其中,所述统计算法包括:四分位距、3sigma模型和置信区间; 在所述候选阈值中确定作为异常值判断标准的所述评估阈值; 所述根据预先确定的评估阈值对所述目标信息熵进行标准化,包括: 当所述目标信息熵小于预先确定的评估阈值时,采用预设的第一算法并根据所述评估阈值和预设的最小信息熵,对所述目标信息熵进行标准化,得到第一标准化信息熵; 所述根据预先确定的评估阈值对所述目标信息熵进行标准化,包括: 当所述目标信息熵不小于预先确定的评估阈值时,采用预设的第二算法并根据所述评估阈值和预设的最大信息熵,对所述目标信息熵进行标准化,得到第二标准化信息熵; 所述第一算法包括: 其中,S1表示所述第一标准化信息熵,表示所述评估阈值,表示预设的最小信息熵,E表示所述目标信息熵; 所述第二算法包括: 其中,S2表示所述第二标准化信息熵,表示所述评估阈值,表示预设的最大信息熵,E表示所述目标信息熵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电数据产业集团有限公司;中电数创(北京)科技有限公司,其通讯地址为:518057 广东省深圳市南山区粤海街道科技园社区科发路3号中电长城大厦A-1908;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励