Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江大学高云君获国家专利权

浙江大学高云君获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江大学申请的专利一种面向时空轨迹大数据的质量评估方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119862401B

龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510347554.7,技术领域涉及:G06F18/21;该发明授权一种面向时空轨迹大数据的质量评估方法是由高云君;王涛;朱俊豪;朱轶凡;赵翔设计研发完成,并于2025-03-24向国家知识产权局提交的专利申请。

一种面向时空轨迹大数据的质量评估方法在说明书摘要公布了:本发明公开了一种面向时空轨迹大数据的质量评估方法,包括:获取轨迹数据集,对轨迹进行聚类以及重分配得到均匀数量的多个簇;对每个簇中的轨迹数据有选择地进行采样得到轨迹子集,从数据有效性、完整性、一致性以及公平性四个维度对轨迹子集进行质量评估,输出违反指标的计数作为数据集的质量评估结果。本发明支持涵盖四个维度有效性、完整性、一致性以及公平性的约束检查,支持对批式历史轨迹数据和流式实时轨迹数据的离线和在线评估,并采用了评估优化策略以提高评估效率。

本发明授权一种面向时空轨迹大数据的质量评估方法在权利要求书中公布了:1.一种面向时空轨迹大数据的质量评估方法,包括如下步骤: 1获取轨迹数据集,对轨迹数据集中的轨迹进行聚类以及重分配得到均匀数量的多个簇;所述轨迹数据集通过GPS设备进行采集获取大量的轨迹,每条轨迹由若干个轨迹点表示,每个轨迹点包含索引、时间戳、经度和纬度的信息;所述轨迹数据集为批式轨迹数据集或流式轨迹数据集,批式轨迹数据集采用离线存储方式对历史轨迹数据进行存储,流式轨迹数据采用在线存储方式对实时轨迹数据进行存储; 对轨迹数据集中的轨迹进行聚类以及重分配的具体过程如下: 1.1首先将整个二维地理空间划分为若干个大小相等的网格单元,然后将轨迹中的每个轨迹点替换为其所属的网格单元,从而将轨迹数据集中的轨迹转换为网格化的表征形式; 1.2对轨迹数据集中的轨迹按长度进行降序排列,取第一条轨迹即长度最大的一条轨迹,以该轨迹为聚类中心初始化一个簇; 1.3按顺序取下一条轨迹TG,将其与所有簇的聚类中心进行比较,若存在某一个簇,其聚类中心与TG有k个网格单元重合,则将TG添加至该簇中,k为设定的阈值,同时若TG的长度大于该簇聚类中心的长度,则将TG作为该簇新的聚类中心;若不存在这样的簇,则以TG为聚类中心新建一个簇; 1.4通过步骤1.3的方式将轨迹数据集中的轨迹聚类成多个簇,并从超过平均轨迹数量的大体量簇中随机选取部分轨迹分配给低于平均轨迹数量的小体量簇,保证每个簇的轨迹数量均匀; 2从所有簇中有选择地通过采样得到轨迹子集,具体实现方式如下: 2.1随机选择一个簇,将该簇中的轨迹按来源分为原始轨迹和分配轨迹,并确定这两类轨迹在簇中的占比,原始轨迹即通过聚类得到的轨迹,分配轨迹即通过重分配从其他簇中得到的轨迹; 2.2从0~1的均匀分布中采样一个随机数,若该随机数大于a,则从该簇的原始轨迹中任取一条轨迹纳入轨迹子集,否则从该簇的分配轨迹中任取一条轨迹纳入轨迹子集,a为原始轨迹在簇中的占比; 2.3反复执行步骤2.1~2.2,直到轨迹子集中的轨迹数量达到设定的数量要求; 3从数据有效性维度对轨迹子集进行质量评估,包括对轨迹点时间戳约束和范围约束的正确性检查,其中时间戳约束即要求同一轨迹上轨迹点的时间戳随时间单调递增,范围约束即要求每一轨迹点的经纬度在指定区域的经纬度限值范围区间内; 4从数据完整性维度对轨迹子集进行质量评估,包括对轨迹缺失点和轨迹点缺失值的检查; 对于轨迹上任意两个连续的轨迹点,若这两个点的时间间隔t大于2Δt,则判定该轨迹存在缺失点,且这两个轨迹点之间的缺失点数量为Δt为该轨迹的采样周期即该轨迹上所有连续两点时间间隔的最小值;若任一轨迹点没有经度值、纬度值或时间戳,则判定该轨迹点存在缺失值; 5从数据一致性维度对轨迹子集进行质量评估,包括对轨迹平滑性约束、轨迹长度约束、异常轨迹、异常轨迹停留点以及轨迹路网约束的检查; 所述轨迹平滑性约束即通过卡尔曼滤波器来检测位置偏差,要求轨迹中轨迹点不能存在突然的位置移动;所述轨迹长度约束即要求轨迹中所有连续两点的Haversine距离累加值≥Lth,Lth为轨迹长度阈值且定为平均轨迹长度标准差的三倍; 所述异常轨迹的判断标准为:对于轨迹子集中的任一轨迹T,若轨迹T中的离群点数量大于给定的阈值ρ,则判定T为异常轨迹;对于轨迹T中任一轨迹点p,若p的邻居点个数小于给定的阈值η,则认定p为离群点;对于轨迹子集中其他轨迹上的任一轨迹点q,若满足distp,q≤σ,则认定q为p的邻居点,distp,q为p与q的Haversine距离,σ为给定的距离阈值; 所述异常轨迹停留点的判断标准为:首先对轨迹子集中的所有轨迹采用小邻域的TrajDBSCAN算法识别出所有可能的停留点,然后对识别出的停留点进行聚类分析,对于其中不属于任何簇的停留点即判定为异常轨迹停留点; 所述轨迹路网约束即要求轨迹必须与道路网络中的路径相匹配,通过OHMM路网匹配算法查找轨迹中每个轨迹点与路网中路段的对应关系,若对应关系不存在,则判定对应轨迹点及其所属轨迹违反轨迹路网约束; 6从数据公平性维度对轨迹子集进行质量评估,包括特定区域内轨迹点的空间密度计算以及特定时段内轨迹点的时间密度计算; 对于特定区域QS,该区域内轨迹点的空间密度其中N为轨迹子集中的轨迹点总数,NQS为轨迹子集中位于特定区域QS内的轨迹点数量,Area为轨迹子集的空间分布区域面积,AreaQS为特定区域QS的面积;对于特定时段Qt,该时段内轨迹点的时间密度NQt为轨迹子集中在特定时段Qt内的轨迹点数量,Time为轨迹子集的整体时间跨度,TimeQt为特定时段Qt的时间跨度; 7根据步骤3~6统计检出的轨迹和轨迹点的数量及占比连同步骤7中计算出的空间密度和时间密度,作为最终的质量评估结果输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。