大连理工大学宋学官获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学申请的专利一种面向隧道掘进机的实测数据离群值检测及修正方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116108339B 。
龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310141397.5,技术领域涉及:G06F18/21;该发明授权一种面向隧道掘进机的实测数据离群值检测及修正方法是由宋学官;王苏杭;王一棠;庞勇;李一阳;刘富文;韩畅阳;刘通设计研发完成,并于2023-02-21向国家知识产权局提交的专利申请。
本一种面向隧道掘进机的实测数据离群值检测及修正方法在说明书摘要公布了:本发明提供了一种面向隧道掘进机的实测数据离群值检测及修正方法,属于异常值数据检测领域,通过滑动窗口的方法对不同工况下的隧道掘进机实测数据进行分层异常值检测,并对异常值点进行修正填补。该方法首先通过滑动窗口将原始时间序列分割成多个子时间序列,并采用快速计算的方式提取子时间序列斜率的置信区间半径并识别异常子时间序列,然后利用局部离群因子算法进一步判定异常值,最后采用回归技术针对剔除后的异常值进行合理填补。本发明能有效识别隧道掘进机实测数据中的异常值,且对异常值进行合理的填补修正,保证了隧道掘进机实测数据工程可用性,为进一步数据分析提供良好的条件。
本发明授权一种面向隧道掘进机的实测数据离群值检测及修正方法在权利要求书中公布了:1.一种面向隧道掘进机的实测数据离群值检测及修正方法,其特征在于,所述的方法分为异常值检测和修正两部分;其中异常值检测部分有两个阶段,第一阶段是异常子时间序列检测,采用滑动窗口的方法将未处理的隧道掘进机实测数据划分成若干个子时间序列,随后提取子时间序列的特征,若该特征超过设定的阈值,则认为该序列为异常子时间序列;第二阶段是局部离群因子LOF算法异常值检测,采用LOF算法检测异常子时间序列中的异常值;异常值修正部分是对异常子序列中正常值点采用最小二乘法建立线性回归模型,预测异常值点数值,最终异常值点数值取多个异常子时间序列预测值的均值;具体如下: 一异常值检测: 输入:长度为n的时间序列,表示为,其中,为时刻记录的数据,采集时间是递增的;滑动窗口长度w,异常子时间序列判断阈值; 输出:异常子时间序列中的异常值; 步骤如下: 第一步,使用长度为w的滑动窗口对隧道掘进机实测数据的时间序列进行等长度划分,得到若干个子时间序列; 第二步,采用公式1计算第一个子时间序列中相邻两点的斜率,采用公式2和公式3分别计算出第一个子时间序列斜率的均值和均方差,从而采用公式4计算出第一个子时间序列斜率的置信区间半径; 所述的公式1、公式2、公式3和公式4表达式为: 1; 2; 3; 4; 其中,为第j个子时间序列斜率的均值,第j个子时间序列斜率的均方差;为置信上限,为置信下限,可分别由公式5和公式6计算得到; 5; 6; 其中,Z为满足N0,1的正态分布随机变量,为置信水平; 第三步,采用公式7由前一个子时间序列计算出本时间序列的斜率和,采用公式8和公式9由前一个子时间序列斜率的均值和均方差计算出本时间序列斜率的均值和均方差,从而采用式4计算出本子时间序列斜率的置信区间半径,其中; 所述的公式7、公式8和公式9表达式为: 7; 8; 9; 第四步,将子时间序列斜率的置信区间半径与阈值进行比较,初步确定含有异常值的异常子时间序列; 第五步,针对第四步检测出的异常子时间序列,采用LOF算法计算每个数据点的离群因子,以此来识别异常值;LOF算法首先采用公式10计算出每个数据点的可达距离,然后通过公式11计算数据点的局部可达密度,最后采用公式12计算数据点的局部离群因子; 所述的公式10、公式11和公式12的表达式为: 10; 11; 12; 其中,点,表示点p到点o的第k可达距离;k-distanceo是点o的K-邻近距离,是指距待测样本点o的最近几个样本中,第k个最近的样本点跟待测检测点o之间的距离,是点p到点o的欧式距离;表示点p的第k距离邻域,指那些距离点p的距离小于k-distancep的集合;表示点p的局部可达密度,实质上就是p的第k邻域内点到p的平均可达距离的倒数,表示点o的局部可达密度;LOFp表示点p的局部离群因子; 第六步,取局部离群因子中最大值的一半作为阈值; 第七步,将每个数据点的离群因子与阈值进行比较,若大于阈值,则该数据点为异常值,否则为正常值; 二异常值修正: 输入:异常子时间序列和异常子时间序列中的异常值; 输出:异常值填补数据集; 步骤如下: 第一步,对输入的异常子时间序列中的正常值采用最小二乘法来预测异常值点的数值; 第二步,记录异常值点在隧道掘进机实测数据中的索引,若异常值填补数据集中无该异常值点索引,则创建该索引和记录预测后的数值,否则,直接记录该索引位置点的预测值; 第三步,若该子时间序列是最后子时间序列,计算异常值填补数据集中每个异常值点的多个子时间序列预测数值的均值,作为该异常值点最终的填补数据;否则,返回异常值检测部分中的第四步。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励