Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学袁理锋获国家专利权

杭州电子科技大学袁理锋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学申请的专利基于属性关联性的时序记录链接数据匹配方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116680325B

龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310747487.9,技术领域涉及:G06F16/2458;该发明授权基于属性关联性的时序记录链接数据匹配方法及装置是由袁理锋;骆鑫辉;任一支;殷为锋;王冬设计研发完成,并于2023-06-25向国家知识产权局提交的专利申请。

基于属性关联性的时序记录链接数据匹配方法及装置在说明书摘要公布了:本发明公开了基于属性关联性的时序记录链接数据匹配方法及装置,该方法首先进行数据预处理,对每个参与链接的数据源数据及用于训练时间关联模型的数据进行清洗。其次进行时间关联模型训练,通过学习训练出预测每个链接属性随时间变化概率的模型。最后进行数据链接实现对来自多个数据源数据的实体识别。该装置包括数据预处理模块、训练模块和链接模块。本发明能准确预测实体属性随时间变化的概率,来调整属性之间的相似性,并显著提高了链接时间记录的准确率,具有普适性以及可扩展性。

本发明授权基于属性关联性的时序记录链接数据匹配方法及装置在权利要求书中公布了:1.基于属性关联性的时序记录链接数据匹配方法,其特征在于,包括如下步骤: S1数据预处理,对每个参与链接的数据源数据及用于训练时间关联模型的数据进行清洗; S2时间关联模型训练,通过学习训练出预测每个链接属性随时间变化概率的模型;具体过程为: S2.1.1为每条记录分配一个唯一的实体标识符,训练数据R中每条训练数据表示为ri,rj,ri,rj表示从训练数据中任意选取的两条记录,其标识符分别为i和j,其中i≠j;同时,记A为用于链接属性集合,链接属性为能够区分实体的属性,则对于每条训练数据ri,rj,从A中依次选取链接属性{A1,A2,…,An},记所选属性为Ak∈A,k∈{1,2,...,n},计算其相对于A的补集并选择集合中的属性作为Ak的关联属性;然后,计算链接属性Ak的关联属性关于时间的状态值集合: 其中,表示ri和rj对应属性An的值是否相同,其计算值为: 其中,sim用于计算记录i和j属性An值的相似性,α为设置的阈值; S2.1.2将链接属性Ak随时间变化的情况分为三类:两条记录属于同一实体,并且链接属性Ak未发生变化;两条记录属于同一实体,并且链接属性Ak发生变化;两条属性不属于同一实体;将链接属性Ak的类别标签记为计算: S2.1.3生成一条关于链接属性Ak的训练数据l:存入哈希表R′[Ak]中,得到新的训练数据集合R′; S2.1.4重复步骤S2.1.1至S2.1.3,直至S2.1.1中所有链接属性对应的训练数据生成完毕; S2.2.1对R′进行关联规则挖掘,记X和Y为两个不同的事件,D为所有事件的总数,countofX为事件X出现的次数,SupportX表示事件X出现的概率,其计算公式为: ConfidenceX|Y表示事件X发生时,Y同时发生的概率,其计算公式为: S2.2.2对于每个链接属性Ak∈A,R′[Ak]中每条训练数据l表示为根据类别标签分别统计链接属性Ak的所有变化情况和链接属性Ak发生改变的情况的出现次数和 计算和调整时间关联性的强度;使用计算结果将R′[Ak]中每条训练数据l更新为: S2.3.1分别对S2.1.2所描述的三个类别构建模型;对于每个类别,使用XGBoost算法分轮次进行训练,每轮构建一个回归树分类器,下一轮回归树在上一轮回归树的基础上再学习;每棵树的输出为当前类别的得分,并将所有树得分加在一起作为当前类别的最终得分; S2.3.2使用Z表示类别,zi表示第i个类别的最终得分,m表示类别总数,经过SoftMax函数,得到A2中每个类别的预测概率,其中第一类的概率用C≠表示,是属性表示同一实体,并且随时间发生改变的概率;第二类的概率用C=表示,是属性表示同一实体,并且随时间保持不变的概率;第三类的概率为1-C≠-C=,是属性表示不同实体的概率; S3数据链接实现对来自多个数据源数据的实体识别,具体过程为: S3.1接收经过预处理得到的数据源数据,并对数据进行聚类,生成多个包含候选记录的簇;同时,接收经过预处理得到的训练数据,并进行信息抽取和关联规则挖掘,构建属性的时间关联模型; S3.2计算候选记录对的相似度,使用时间关联模型为属性分配权重,根据权重调整相似度,生成匹配结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。