Mining of Monitoring Data for Sanmendong Landslide in the Three Gorges Reservoir Area
-
摘要:
基于传统的关联规则挖掘方法分析三峡库区地质灾害监测大数据时,需要通过多次扫描数据才能挖掘出频繁项集,存在速度较慢、效率低的问题。本文采用FP-Growth算法,以三门洞滑坡为例,选择降雨和库水位两类影响因素,细分出6种影响因子,与滑坡位移监测数据进行关联规则挖掘。筛选出8条关联规则结果并对其分析,发现了滑坡位移与大气降雨、库水位之间存在较大的相关性。降雨量越大,连续降雨时间越长,滑坡位移越大;单位时间内库水位变动越大,滑坡位移越大,库水位下降对滑坡位移产生的影响比库水位上升要大。研究结果表明,FP-Growth算法较传统关联规则挖掘方法效率更高,更加适合大数据分析,可提供大数据中隐含的、可理解的、有价值的信息,挖掘出的监测数据关联规则有助于滑坡变形分析。针对三峡库区地质灾害防治数据具有多源、异构、海量的特点,应更多的应用大数据分析技术,以发现数据中的规律,指导地质灾害防治工作。
-
关键词:
- 关联规则 /
- FP-Growth算法 /
- 大数据分析 /
- 三门洞滑坡 /
- 三峡库区
Abstract:When traditional association rule mining methods is used to analyze geological hazard monitoring big data in the Three Gorges Reservoir area, multiple scanning of the data is required to mine frequent itemsets, resulting in slow speed and low efficiency. By adopting the FP-Growthalgorithm, and with the Sanmendong landslide as an example, two types of influencing factors, i.e. rainfall and reservoir water level, are selected, and six influencing factors are further subdivided for association rule mining with landslide displacement monitoring data. Eight association rule results are screened out and analyzed to find that there is a significant correlation between landslide displacement and atmospheric rainfall as well as reservoir water level, i.e. the greater the rainfall is, the longer the continuous rainfall time lasts, the greater the landslide displacement is; the greater the change of the reservoir water level per unit time is, the greater the landslide displacement is. The impact of a decrease in reservoir water level on landslide displacement is greater than that of an increase in reservoir water level. The research results indicate that, being more efficient than traditional association rule mining methods andmore suitable for big data analysis, the FP-Growth algorithm can provide implicit, comprehensible and valuable information in big data, and the association rules mined from monitoring data are helpful for landslide deformation analysis. Given the characteristics of multi-source, heterogeneous, and massive geological disaster prevention and control data in the Three Gorges Reservoir area, big data analysis techniques should be more widely applied in geological disaster prevention and control work in the Three Gorges Reservoir area.
-
-
表 1 影响因子
Table 1. Influencing factors
影响因素 影响因子 符号 单位 降雨量累计值(月) Rm mm 降雨 降雨量日最大值(月) Rd-max mm 连续降雨量最大值(月) Rm-max mm 库水位平均值(月) Wd m 库水位 库水位上升最大值(月) Wm-up m 库水位下降最大值(月) Wm-down m 表 2 聚类分析结果
Table 2. Cluster analysis results
影响因子 定性化值 分级区间 Rm(mm) 大 (167.6,477.8) 中 (62.2,162.3) 小 (3.7,59.5) Rd-max(mm) 大 (45.9,137.8) 中 (21.6,45.3) 小 (1.1,21.2) Rm-max(mm) 大 (93.2,200.3) 中 (29.6,91.2) 小 (1.7,28.2) Wd(m) 大 (166.8,174.5) 中 (155.7,165.3) 小 (145.3,153.9) Wm-up(m) 大 (13.7,19.9) 中 (5.3,10.6) 小 (0.6,4.5) Wm-down(m) 大 (14.5,19.6) 中 (8.7,12.6) 小 (1.2,6.6) 累计位移量(月)(mm) Ⅲ (118,151.5) Ⅱ (43,85) Ⅰ (0,26) 表 3 关联规则结果
Table 3. Association rule results
规则ID 前项 后项 支持度(%) 置信度(%) 提升度(%) 1 Rd-max=中&Rm-max=中 Ⅰ 47.5 91 1.16 2 Rm=中&Rd-max=高 Ⅰ 45.6 87 1.20 3 Rm=中&Wd=中 Ⅰ 43.1 83 1.21 4 Rd-max=中&Wd=低&Wm-down=中 Ⅱ 41.8 100 1.23 5 Rm-max=中&Wm-down=中 Ⅱ 39.6 100 1.26 6 Rd-max=高&Rm-max=中&Wd=中 Ⅱ 36.2 93 1.28 7 Rm=高&Wd=低&Wm-down=高 Ⅲ 31.3 79 1.31 8 Rm-max=高&Wd=低 Ⅲ 33.5 71 0.96 -
[1] 贲琰棋,易 武,黄晓虎,魏兆亨,肖宇煌,邓欣雨.2023.基于有效降雨量的“阶跃型”滑坡递进式预警模型研究[J]. 华南地质,39(3):492-501.
[2] 陈 波,詹明强,黄梓莘.2022.基于关联规则的库岸边坡监测数据挖掘方法[J]. 长江科学院院报,39(8):58-64. doi: 10.11988/ckyyb.20210457
[3] 崔芳姿,吴 斌,史学磊,范振林,任 涛.2021.地质灾害监测数据综合处理与分析[J]. 地理空间信息,19(7):88-92+8. doi: 10.3969/j.issn.1672-4623.2021.07.025
[4] 段功豪,牛瑞卿,咬登魁.2014.基于关联规则算法的滑坡判据动态提取研究[J]. 安全与环境工程,21(6):47-52. doi: 10.3969/j.issn.1671-1556.2014.06.009
[5] 朱鸿鹄,王 佳,李厚芝,叶 霄,施 斌,张 勤.2022.基于数据挖掘的三峡库区特大滑坡变形关联规则研究[J]. 工程地质学报,30(5):1517-1527.
[6] 胡友鑫,林茂彦,罗剪秋,陈 超,黄金煜. 2025. 复杂网络高阶结构的关联规则挖掘及其应用[J]电子科技大学学报,54(1):152-160.
[7] 吕梅洁. 2024. 基于关联规则的滑坡监测数据挖掘研究[D]. 河北地质大学硕士学位论文,43-54.
[8] 刘鹏程. 2018. 大数据分析技术在地质灾害系统中的应用研究[D]. 西安工业大学硕士学位论文,10-16.
[9] 李明亮,吕梅洁,侯梦媛,朱昊.2024.基于Eclat算法的八字门滑坡变形因素关联性分析[J]. 长江科学院院报,41(6):150-155. doi: 10.11988/ckyyb.20230595
[10] 李 瑞,刘 珊,闫 磊.2024.基于FP-Growth算法的新能源配电网CPS网络攻击检测方法[J]. 电信科学,40(11):103-113. doi: 10.11959/j.issn.1000-0801.2024229
[11] 马 健,谢雨晴,张丽岩,王 燕,周欢生.2024.基于FP-growth算法的交通事故数据关联规则挖掘研究[J]. 科技创新与生产力,45(9):95-97. doi: 10.3969/j.issn.1674-9146.2024.09.095
[12] 马俊伟,唐辉明,邹宗兴,刘 晓,温 韬,王艳昆. 2019. 滑坡位移预测的智能算法与应用实例[M]. 武汉:中国地质大学出版社,23-66.
[13] 佘欣媛.2024.基于FP-Growth+LSTM的问题发现及行为预测模型[J]. 科技与创新,(11):10-14.
[14] 尚 敏,廖 芬,马 锐,刘昱廷.2021.白家包滑坡变形与库水位、降雨相关性定量化分析研究[J]. 工程地质学报,29(3):742-750.
[15] 孙义杰. 2015. 库岸边坡多场光纤监测技术与稳定性评价研究[D]. 南京大学博士学位论文,90-123.
[16] 谢林冲,王明清,周 超.2020.基于降雨-库水联合作用下三门洞滑坡演化过程与机制[J]. 水电能源科学,38(6):128-132.
[17] 吴 婷,牛瑞卿.2011.三峡库区巴东段地质灾害因子关联规则挖掘[J]. 计算机工程与应用,47(11):240-244. doi: 10.3778/j.issn.1002-8331.2011.11.068
[18] 许 强.2020.对滑坡监测预警相关问题的认识与思考[J]. 工程地质学报,28(2):360-374.
[19] 宣正邦,黄树成,王 逊.2022.一种基于Hadoop的Apriori改进算法[J]. 计算机与数字工程,50(3):459-462. doi: 10.3969/j.issn.1672-9722.2022.03.001
[20] 余飞娅,叶文波.2021.基于FP-Growth算法的计量主站告警分析研究[J]. 电气自动化,43(6):30-32+35. doi: 10.3969/j.issn.1000-3886.2021.06.010
[21] 杨 柯,叶润青,付小林,牛瑞卿.2020.三峡库区第四系特征关联规则分析[J]. 人民长江,51(6):118-124.
[22] 杨诗诗,叶润青,付小林,吴润泽,熊 能,文天龙.2023.三峡库区降雨型滑坡预警雨量阈值研究[J]. 华南地质,39(3):445-454. doi: 10.3969/j.issn.2097-0013.2023.03.004
[23] 袁乾博,肖诗荣,李春霞,夏 宇,王 涛.2020.基于GLSSVM模型的三门洞滑坡变形预测研究[J]. 人民长江,51(7):130-135.
[24] 易庆林,覃世磊,文 凯,周 宝,曾怀恩.2018.三峡库区三门洞滑坡变形特征与影响因素分析[J]. 三峡大学学报(自然科学版),40(5):41-46.
[25] 赵恩毅.2024.大数据中的数据清洗与预处理技术研究[J]. 信息记录材料,25(3):195-197. doi: 10.3969/j.issn.1009-5624.2024.3.xxjlcl202403062
[26] Huang H F, Yi W, Lu S Q, Yi Q L, Zhang G D. 2016. Use of monitoring data to interpret active landslide movements and hydrological triggers in Three Gorges reservoir[J]. Journal of Performance of Constructed Facilities, 30(1): 1-11.
-