留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于Hampel滤波的海洋磁测数据异常值检测方法研究

谢宇轩 范琳琳 郭鑫 黄彦铭 张锦昌

谢宇轩,范琳琳,郭鑫,等. 基于Hampel滤波的海洋磁测数据异常值检测方法研究[J]. 海洋学报,2025,47(4):53–64 doi: 10.12284/hyxb2025039
引用本文: 谢宇轩,范琳琳,郭鑫,等. 基于Hampel滤波的海洋磁测数据异常值检测方法研究[J]. 海洋学报,2025,47(4):53–64 doi: 10.12284/hyxb2025039
Xie Yuxuan,Fan Linlin,Guo Xin, et al. Research on outlier detection in marine magnetic data based on Hampel filtering[J]. Haiyang Xuebao,2025, 47(4):53–64 doi: 10.12284/hyxb2025039
Citation: Xie Yuxuan,Fan Linlin,Guo Xin, et al. Research on outlier detection in marine magnetic data based on Hampel filtering[J]. Haiyang Xuebao,2025, 47(4):53–64 doi: 10.12284/hyxb2025039

基于Hampel滤波的海洋磁测数据异常值检测方法研究

doi: 10.12284/hyxb2025039
基金项目: 国家自然科学基金项目(42376071, 42006056);中国科学院南海海洋研究所自主部署项目(SCSIO2024QY02);中国科学院项目(Y4SL021)。
详细信息
    作者简介:

    谢宇轩(2000—),男,湖北省天门市人,从事海洋地球物理学研究。E-mail:650819080@qq.com

    通讯作者:

    黄彦铭,副教授,从事海洋地质与海洋地球物理学研究。E-mail: yanming8511@163.com

    张锦昌,研究员,从事海洋地质与海洋物理学研究。Emal:jzhang@scsio.ac.cn

  • 中图分类号: P738.3

Research on outlier detection in marine magnetic data based on Hampel filtering

  • 摘要: 海洋磁测数据易受导航误差、仪器故障及人工记录错误等因素干扰,导致异常值频现。这些异常值不仅扭曲磁异常形态,还会破坏磁条带的连续性,严重影响数据质量及后续解释的可靠性。因此,异常值的检测与去除是海洋磁测数据处理中的关键环节。然而,传统方法难以有效区分不同类型的异常值,尤其是上下文异常值,且人工检测既耗时又易产生误判,效率较低。针对这一问题,本研究提出了一种基于局部中位数加权策略的自适应Hampel滤波方法。该方法通过动态调整数据点权重,能够更精准地识别和去除海洋磁测数据中的异常值,尤其在数据分布异质性较大的区域表现优异。与自回归模型、孤立森林及自编码器等传统方法相比,加权Hampel滤波器不仅能够有效检测并去除全局异常值和上下文异常值,还能更好地保留数据的原始特征,显著提升了检测精度。在对中西太平洋麦哲伦海隆地区实测数据的验证中,加权Hampel滤波器的F1分数始终领先于其他方法,证明其在异常值检测中的优越性。该方法为提升海洋磁测数据质量及可解释性提供了重要技术支持,并为未来大规模数据的自动化处理奠定基础。
  • 图  1  全局异常值(左)与上下文异常值(右)示例

    Fig.  1  Examples of global outliers (left) and contextual outliers (right)

    图  2  GH7801航次海洋磁测磁异常数据分布

    a.包含显而易见的全局异常值的原始磁异常数据,图2a中的矩形指示图2b中的放大范围;b.图2a中矩形区域的细节展示

    Fig.  2  Distribution of marine magnetic anomaly data from the GH7801 survey

    a. Original magnetic anomaly data containing obvious global outliers, with the rectangle in Fig. 2a indicating the zoomed-in region shown in Fig. 2b; b. detailed view of the rectangular region in Fig. 2a

    图  3  加权后的Hampel滤波器异常值识别结果及细节子图(a、b);未加权的Hampel滤波器异常值识别结果及细节子图(c、d)

    Fig.  3  Weighted Hampel filter outlier detection results and detailed subplot (a, b); unweighted Hampel filter outlier detection results and detailed subplot (c, d)

    图  4  不同参数选择的影响

    k代表滤波窗口,T代表阈值。红色矩形与蓝色矩形区域突出显示不同参数选择导致的异常值检测结果差异较明显的区域

    Fig.  4  The impact of different parameter choices

    k represents the filter window, and T represents the threshold. The red and blue rectangular regions highlight areas where the differences in outlier detection results due to different parameter selections are particularly evident

    图  5  自编码器示意图:编码层将输入数据X降维至Z,解码层将数据投影回原始维度得到X'

    Fig.  5  Autoencoder schematic: the encoder layer reduces the input data X to a lower-dimensional representation Z, while the decoder layer projects the data back to the original dimension to obtain X'

    图  6  孤立森林示意图:更短路径长度的数据点将被隔离识别出来

    Fig.  6  Isolation Forest schematic: data points with shorter path lengths are identified as outliers and isolated

    图  7  a. OR-1异常值检测结果(为了使5种方法同时对比,将后4种方法对应的磁异常数值大小每次减小3 000 nT,以此绘制到同一张图中进行比较);b. SY-1异常值检测结果(绘制方法同于图7a)

    Fig.  7  a. OR-1 outlier detection results (to enable a comparison of the five methods, the magnetic anomaly values of the remaining four methods are each reduced by 3 000 nT and plotted on the same graph); b. SY-1 outlier detection results (the plotting method isthe same as that in Fig. 7a)

    表  1  5种算法分别应用于5条示例数据段的F1分数统计

    Tab.  1  The F1 score statistics of five algorithms applied to five example data segments

    方法名称 OR-1 OR-2 OR-3 SY-1 SY-2
    加权Hampel滤波器 0.9091 0.9804 0.9310 0.9455 0.9375
    未加权Hampel滤波器 0.8387 0.9600 0.8800 0.8276 0.9032
    自回归模型 0.7692 0.8335 0.6136 0.4816 0.4615
    自编码器神经网络 0.6250 0.9615 0.7500 0.2963 0.1131
    孤立森林 0.6250 0.9796 0.9474 0.4000 0.3077
    下载: 导出CSV

    A1  OR-1 5种方法参数及F1分数统计

    A1  The parameters and F1 score statistics of five algorithms for OR-1

    方法 参数 精确率 召回率 F1分数
    加权Hampel滤波器 k = 3, T = 8 0.8824 0.9375 0.9091
    未加权Hampel滤波器 k = 3, T = 8 0.8667 0.8125 0.8387
    孤立森林 C = 0.02 0.6250 0.6250 0.6250
    自回归模型 L = 15 1.0000 0.6250 0.7692
    自编码器神经网络 C = 0.02 0.6250 0.6250 0.6250
    下载: 导出CSV

    A2  OR-2 5种方法参数及F1分数统计

    A2  The parameters and F1 score statistics of five algorithms for OR-2

    方法 参数 精确率 召回率 F1分数
    加权Hampel滤波器 k = 5, T = 8 0.9615 1.0000 0.9804
    未加权Hampel滤波器 k = 5, T = 8 0.9600 0.9600 0.9600
    孤立森林 C = 0.025 1.0000 0.9600 0.9796
    自回归模型 L = 15 0.8696 0.8000 0.8335
    自编码器神经网络 C = 0.028 0.9259 1.0000 0.9615
    下载: 导出CSV

    A3  OR-3 5种方法参数及F1分数统计

    A3  The parameters and F1 score statistics of five algorithms for OR-3

    方法 参数 精确率 召回率 F1分数
    加权Hampel滤波器 k = 5, T = 8, μ = 900 0.9000 0.9643 0.9310
    未加权Hampel滤波器 k = 5, T = 8 1.0000 0.7857 0.8800
    孤立森林 C = 0.085 0.9310 0.9643 0.9474
    自回归模型 L = 15 0.4500 0.9643 0.6136
    自编码器神经网络 C = 0.01 0.6667 0.8571 0.7500
    下载: 导出CSV

    A4  SY-1 5种方法参数及F1分数统计

    A4  The parameters and F1 score statistics of five algorithms for SY-1

    方法 参数 精确率 召回率 F1分数
    加权Hampel滤波器 k = 5, T = 8 0.8947 1.0000 0.9455
    未加权Hampel滤波器 k = 5, T = 8 1.0000 0.7059 0.8276
    孤立森林 C = 0.012 0.3478 0.4706 0.4000
    自回归模型 L = 15 0.3636 0.7059 0.4816
    自编码器神经网络 C = 0.02 0.2162 0.4706 0.2963
    下载: 导出CSV

    A5  SY-2 5种方法参数及F1分数统计

    A5  The parameters and F1 score statistics of five algorithms for SY-2

    方法 参数 精确率 召回率 F1分数
    加权Hampel滤波器 k = 5, T = 8 0.9375 0.9375 0.9375
    未加权Hampel滤波器 k = 5, T = 8 0.9333 0.8750 0.9032
    孤立森林 C = 0.006 0.2222 0.5000 0.3077
    自回归模型 L = 15 0.3061 0.9375 0.4615
    自编码器神经网络 C = 0.006 0.0811 0.1875 0.1131
    下载: 导出CSV
  • [1] 孙昊, 李志炜, 熊雄. 海洋磁力测量技术应用及发展现状[J]. 海洋测绘, 2019, 39(6): 5−8, 20.

    Sun Hao, Li Zhiwei, Xiong Xiong. Application and development of marine magnetic surveying technology[J]. Hydrographic Surveying and Charting, 2019, 39(6): 5−8, 20.
    [2] 管志宁. 地磁场与磁力勘探[M]. 北京: 地质出版社, 2005.

    Guan Zhining. Geomagnetic Field And Magnetic Exploration[M]. Beijing: Geological Publishing House, 2005.
    [3] Vine F J, Matthews D H. Magnetic Anomalies over Oceanic Ridges[M]. Nature Publishing, 1963: 947−949.
    [4] Gee J S, Kent D V. Source of oceanic magnetic anomalies and the geomagnetic polarity time scale[J]. Treatise on Geophysics, 2007, 5: 455−507. doi: 10.1016/B978-044452748-6/00097-3
    [5] Quesnel Y, Catalán M, Ishihara T. A new global marine magnetic anomaly data set[J]. Journal of Geophysical Research: solid earth, 2009, 114(B4): B04106.
    [6] Lai K H, Zha Daochen, Xu Junjie, et al. Revisiting time series outlier detection: definitions and benchmarks[C]//35th Conference on Neural Information Processing Systems Datasets and Benchmarks Track (Round 1). New York: Curran Associates, 2021.
    [7] Braei M, Wagner S. Anomaly detection in univariate time-series: a survey on the state-of-the-art[EB/OL]. (2020-04-01)[2024-12-02]. https://doi.org/10.48550/arXiv.2004.00433.
    [8] Pang Guansong, Shen Chunhua, Cao Longbing, et al. Deep learning for anomaly detection: a review[J]. ACM Computing Surveys, 2020, 54(2): 1−38.
    [9] Huang Yanming, Sager W W, Zhang Jinchang, et al. Magnetic anomaly map of shatsky rise and its implications for oceanic plateau formation[J]. Journal of Geophysical Research: Solid Earth, 2021, 126(2): e2019JB019116. doi: 10.1029/2019JB019116
    [10] Thoram S, Sager W W, Gaastra K, et al. Nature and origin of magnetic lineations within valdivia bank: ocean plateau formation by complex seafloor spreading[J]. Geophysical Research Letters, 2023, 50(13): e2023GL103415. doi: 10.1029/2023GL103415
    [11] Meyer B, Chulliat A, Saltus R. Derivation and error analysis of the earth magnetic anomaly grid at 2 arc min resolution version 3 (EMAG2v3)[J]. Geochemistry, Geophysics, Geosystems, 2017, 18(12): 4522−4537. doi: 10.1002/2017GC007280
    [12] Ishihara T. A new leveling method without the direct use of crossover data and its application in marine magnetic surveys: weighted spatial averaging and temporal filtering[J]. Earth, Planets and Space, 2015, 67(1): 11. doi: 10.1186/s40623-015-0181-7
    [13] Pearson R K, Neuvo Y, Astola J, et al. Generalized hampel filters[J]. EURASIP Journal on Advances in Signal Processing, 2016, 2016: 87. doi: 10.1186/s13634-016-0383-6
    [14] Alken P, Thébault E, Beggan C D, et al. International Geomagnetic Reference Field: The thirteenth generation[J]. Earth, Planets and Space, 2021, 73: 49. doi: 10.1186/s40623-020-01288-x
    [15] Sabaka T J, Olsen N, Purucker M E. Extending comprehensive models of the Earth’s magnetic field with Ørsted and CHAMP data[J]. Geophysical Journal International, 2004, 159(2): 521−547. doi: 10.1111/j.1365-246X.2004.02421.x
    [16] Rousseeuw P J, Leroy A M. Robust Regression and Outlier Detection[M]. New York: John Wiley & Sons, 2005.
    [17] Sakurada M, Yairi T. Anomaly detection using autoencoders with nonlinear dimensionality reduction[C]//Proceedings of the MLSDA 2014 2nd Workshop on Machine Learning for Sensory Data Analysis. New York: Association for Computing Machinery, 2014: 4−11.
    [18] Zhao Yue, Nasrullah Z, Li Zheng. PyOD: a python toolbox for scalable outlier detection[J]. Journal of Machine Learning Research (JMLR), 2019, 20: 1−7.
    [19] Liu F T, Ting K M, Zhou Zhihua. Isolation forest[C]//2008 Eighth Ieee International Conference On Data Mining. Pisa: IEEE, 2008: 413−422.
    [20] Munir M, Siddiqui S A, Dengel A, et al. DeepAnT: a deep learning approach for unsupervised anomaly detection in time series[J]. IEEE Access, 2019, 7: 1991−2005. doi: 10.1109/ACCESS.2018.2886457
  • 加载中
图(7) / 表(6)
计量
  • 文章访问数:  78
  • HTML全文浏览量:  37
  • PDF下载量:  6
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-12-02
  • 修回日期:  2025-03-11
  • 网络出版日期:  2025-04-24
  • 刊出日期:  2025-04-30

目录

    /

    返回文章
    返回