Research on typhoon wave height prediction method based on BO-LSTM neural network model
-
摘要: 随着海平面上升和风暴增强等气候变化的影响,快速准确地预报台风浪波高对于海岸保护和海洋灾害预防显得格外重要。本文首先基于TCWiSE模型生成大量的虚拟台风,利用SWAN数值模式计算台风期间测站处的有效波高,并构建台风浪样本数据库;然后对BO-LSTM神经网络模型的输入因素和超参数进行评估和选取,结合样本数据库对其进行训练和测试。结果表明:所构建的虚拟台风与历史台风具有很好的相似性,可以为台风浪波高智能预报模型的搭建提供充足的数据基础;所搭建的BO-LSTM模型可以快速实现单一站点处的台风浪波高智能预报,并具有媲美SWAN的预报精度,其在长时间预报场景中的预报精度显著优于RF模型和BPNN模型;将预报的未来台风数据添加到BO-LSTM模型的输入中,进一步提高了模型的预报精度和预报未来时长,其预报未来24 h的Bias、RMSE和R2分别为−0.102 m、0.494 m和0.855。研究成果为极端天气下台风浪的智能预报提供一种可行的实现途径。Abstract: With the impact of climate change such as rising sea levels and intensified storms, it is particularly important to quickly and accurately predict typhoon wave heights for coastal protection and marine disaster prevention. This article first generates a large number of virtual typhoons based on the TCWiSE model, uses the SWAN numerical model to calculate the significant wave height at the observation station during the typhoon, and constructs a sample database of typhoon waves; then evaluates and selects the input factors and hyperparameters of the BO-LSTM neural network model, and trains and tests it using a sample database. The results show that the constructed virtual typhoon has good similarity with historical typhoons, which can provide sufficient data basis for the construction of intelligent typhoon wave height prediction models. The BO-LSTM model built can quickly achieve intelligent prediction of typhoon wave height at a single station, and has prediction accuracy comparable to SWAN. Its prediction accuracy in long-term forecasting scenarios is significantly better than RF and BPNN models. Adding future typhoon data to the input of the BO-LSTM model further improves the accuracy and duration of the model’s forecast. Its Bias, RMSE and R2 for predicting the next 24 h are −0.102 m, 0.494 m and 0.855, respectively. The research results provide a feasible approach for intelligent forecasting of typhoon waves under extreme weather conditions.
-
Key words:
- typhoon waves /
- wave height forecast /
- LSTM model /
- bayesian optimization /
- virtual typhoon
-
1. 引言
台风浪是指受热带气旋扰动而形成的海洋波浪,极端情况下其浪高可达数十米,是我国主要的海洋灾害之一[1]。由台风浪引起的水位急剧上升、波浪冲击、沿岸侵蚀等灾害性影响,会对沿海堤防、跨海桥梁、海上航运、海产养殖和海洋平台等重大涉海工程产生不同程度的危害。因此,快速准确地预报台风浪,并根据预报结果提前采取防护措施,对保障沿海地区人员和财产的安全具有十分重要的意义。
目前台风浪预报方法主要分为经验预报法、数值预报法和智能预报法[2]。由于台风浪生成具有复杂的物理机制,起初人们只能依赖于经验预报法,其中最具代表性的方法是Wilson经验预报法[3],该方法建立了波高与波速、风区长度、风速3个变量之间的经验函数关系,在早期的海浪预报中具有重要的地位。以第三代海浪谱模式为代表的数值预报法是当前应用最为广泛的海浪预报方法[4–5],其具有较为完善的物理机制,考虑了波浪与波浪以及波浪与外部环境之间的多种相互作用,目前主流的业务化数值模式包括WAM(WAve Modelling)、WW3(WAVEWATCH Ⅲ)和SWAN(Simulating WAves Nearshore)。然而,经验预报法区域化显著,且在高度变异性的海洋区域,其预报结果往往不准确,缺少广泛适用性;数值预报法由于其输入项目较多、边界条件复杂,需要耗费大量的计算资源和时间,所以在实际应用中依然存在一些局限和不足。
随着人工智能的快速普及,以神经网络、支持向量机和随机森林等为代表的机器学习算法为现代海浪预报提供了全新的发展方向,其中长短期记忆神经网络(Long Short Term Memory, LSTM)由于其在处理时间序列数据时具有出色的性能,目前已成为海浪智能预报领域中的主流算法。2020年,Fan等[6]将LSTM模型应用于带有时序特征的波高预报中,利用全球范围内10个不同环境中海洋浮标的数据对模型进行训练和测试,验证了LSTM在海浪预报中相较其他机器学习算法的优越性。2021年,Zhou等[7]结合了长短期记忆神经网络和卷积神经网络的优势,提出了一种非常适合预报二维波场的ConvLSTM模型,并对东海和南海区域进行了海浪预报。2022年,Gao等[8]将风场和多种波浪参数输入到ConvLSTM模型中,为神经网络模型添加了更多物理机制特征,进一步提升了模型的预报性能。
现阶段对于台风浪预报具有预报精度、预报效率和预报未来时长3个方面的要求,这也促进了机器学习算法在台风浪预报领域的快速发展。现有相关研究大多采用测站实测资料或再分析资料(ERA-5、CFSR等)作为机器学习模型的样本数据,然而实测资料数据量不够充足,再分析资料中台风风场的强度普遍低于实测台风强度[9],这将造成训练出的模型在极端天气下预报台风浪的精度不尽人意。此外,经典的LSTM模型在超参数的选取中很难找到最佳方案,这将耗费大量的时间和精力。
为了克服上述现有不足,本文首先基于历史台风资料和TCWiSE(Tropical Cyclone Wind Statistical Estimation Tool)模型构建大量的虚拟台风,再利用SWAN数值模式模拟台风浪的生成,从而解决了实测台风浪数据量不足和再分析台风风场强度偏低的问题;然后采用贝叶斯优化算法(Bayesian Optimization, BO)对LSTM模型进行超参数优化,兼顾了调优效果和所耗费的时间精力;最后结合台风浪数据对模型进行训练和测试,进而实现精确、高效和预见期较长的波高预报,为台风浪智能预报提供一种可行的实现途径。
2. 资料和方法
2.1 资料来源
2.1.1 台风资料
本文所使用的台风资料是由中国气象局(China Meteorological Administration, CMA)热带气旋资料中心发布的西北太平洋海域热带气旋最佳路径数据集[10–11],该数据集记录了1949年以来年西北太平洋地区热带气旋每6 h的位置和强度。本文整理了1979–2022年西北太平洋地区共
1128 场实测历史台风的路径信息,包括台风时间、经度、纬度、中心最低气压和近中心最大风速等信息。历史台风资料主要用于构建虚拟台风和测试神经网络,图1为1979–2022年西北太平洋地区历史台风的路径图。2.1.2 波浪资料
本文所使用的实测波浪资料来源于浙江沿海的3个波浪测站,包括温外浮标(27.50°N,122.50°E)、舟山站(29.89°N,122.42°E)和东瓯站(27.68°N,121.36°E),所收集各测站资料的时间范围分别为2019年8月8日到8月10日、2020年8月3日到8月5日和2022年9月4日到9月6日,各测站的位置分布如图2所示。收集到的资料包括台风期间时间分辨率为30 min或60 min的波浪信息,主要利用实测有效波高数据来验证数值模式模拟波浪的准确性。
2.2 研究方法
2.2.1 TCWiSE模型
TCWiSE模型是由荷兰代尔夫特理工大学Nederhoff等[12]提出的一种用于构建虚拟台风的模型,利用该模型可以模拟出热带气旋的运动路径和近中心最大风速。其核心思想是基于核密度估计法对历史台风行进过程中各特征参数的变化量进行概率分布拟合,并据此不断更新虚拟台风的特征参数以形成完整的虚拟台风事件。核密度估计法的公式如下:
$$ f\left(x\right)=\frac{1}{Nh}\sum_{i\ =\ 1}^NK\left(\frac{X_i-\overline{X}}{h}\right), $$ (1) 式中,
$ f\left(x\right) $ 为概率密度函数;$ N $ 为样本总数;$ h $ 为带宽;$ K $ 为核函数;$ {X}_{i} $ 表示样本值,且$ {X}_{i} $ 服从独立同分布;$ \bar{X} $ 表示样本值的均值。本文利用TCWiSE模型构建虚拟台风的具体步骤如下:首先,对1979–2022年西北太平洋地区共
1128 场热带气旋进行了统计分析,得到研究区域内历史台风年发生频数和起始参数(台风发生时间、移速、移向、近中心最大风速)的概率分布,利用蒙特卡洛法从各组数据中随机取样形成参数组合,以此确定虚拟台风每一年内发生的场数以及每场虚拟台风的起始参数。其次,将西北太平洋区域划分为5° × 5°的网格,统计网格内历史台风起始和终止的概率,基于各网格中历史台风的起始概率可以确定虚拟台风的起始位置。同时,采用核密度估计法拟合各个网格内历史台风移速变化量、移向变化量和近中心最大风速变化量的概率分布。然后,针对一场已经具有各种起始参数的虚拟台风,以3 h为时间步长计算虚拟台风的下一个节点位置,基于该节点位置所处网格中各参数变化量的概率分布抽取一组变化量组合,以此更新虚拟台风的3个关键特征参数(台风移速、移向、近中心最大风速),循环往复直至满足台风终止条件。最后,当从虚拟台风所处网格中抽取到终止命令、台风近中心最大风速低于5.2 m/s或者海温低于10℃时,虚拟台风立即终止[12]。此外,考虑到台风中心最低气压与近中心最大风速存在负相关关系,故基于Copula联合分布函数对虚拟台风的中心最低气压进行赋值,至此表示一场虚拟台风模拟完成。2.2.2 SWAN波浪模式
SWAN是由荷兰代尔夫特理工大学基于波作用量守恒方程开发的第三代海浪数值模式[13],可以用于模拟海洋和内陆水域中的波浪特性,包括波高、波长、波向和波浪频谱等参数。该模式的控制方程在直角坐标系下采用如下形式:
$$ \frac{\partial }{\partial t}N+\frac{\partial }{\partial x}{c}_{x}N+\frac{\partial }{\partial y}{c}_{y}N+\frac{\partial }{\partial \sigma }{c}_{\sigma }N+\frac{\partial }{\partial \theta }{c}_{\theta }N=\frac{S}{\sigma }, $$ (2) 式中,
$ N $ 为波作用量密度;$ t $ 为时间;$ x $ 、$ y $ 为地理坐标;$ \sigma $ 为相对波频;$ \theta $ 为波向;$ {c}_{x} $ 和$ {c}_{y} $ 为波浪传播速度在$ x $ 和$ y $ 方向上的分量;$ {c}_{\sigma } $ 和$ {c}_{\theta } $ 为波浪在$ \sigma $ 和$ \theta $ 空间的传播速度;$ S $ 为波能密度,可以写成:$$ S={S}_{in}+{S}_{nl3}+{S}_{nl4}+{S}_{ds,W}+{S}_{ds,b}+{S}_{ds,br} ,$$ (3) 式中,
$ {S}_{in} $ 表示风能的输入;$ {S}_{nl3} $ 、$ {S}_{nl4} $ 分别表示三、四阶非线性相互作用产生的波能交换;$ {S}_{ds,W} $ 、$ {S}_{ds,b} $ 、$ {S}_{ds,br} $ 分别表示白浪、底摩擦和波浪破碎引起的波能耗散。本文采用非结构化三角形网格作为SWAN模式的计算网格,网格范围及水深如图2所示,网格边界跨度为23.8°~41.0°N和117.5°~131.5°E,网格计算节点数为
39122 ,网格单元数为74943 ,开边界处网格分辨率约为0.3°,浙江沿海区域网格较为精细,分辨率约为0.03°。风场数据的质量很大程度上决定了波浪模式模拟结果的准确性,本文采用应用较为广泛的Holland台风模型[14]来生成台风风场。Holland台风模型由气压场模型和风场模型共同构成,其对于台风中心附近的风场具有较好的模拟效果[15–16],模型具体的原理和计算方法可见其说明文献[14],此处不再赘述。
2.2.3 BO-LSTM神经网络模型
BO-LSTM(Bayesian Optimization-Long Short Term Memory)模型由BO算法和LSTM神经网络两部分组成。其中LSTM神经网络由多个重复单元组成[17],如图3所示,每个单元包含3个关键组件:遗忘门、输入门和输出门,其计算公式如下:
$$ {f}_{t}={\mathrm{sigmoid}}\left({W}_{f}\left[{h}_{t-1},{x}_{t}\right]+{b}_{f}\right) ,$$ (4) $$ {i}_{t}={\mathrm{sigmoid}}\left({W}_{i}\left[{h}_{t-1},{x}_{t}\right]+{b}_{i}\right), $$ (5) $$ {o}_{t}={\mathrm{sigmoid}}\left({W}_{o}\left[{h}_{t-1},{x}_{t}\right]+{b}_{o}\right), $$ (6) $$ {\widetilde{C}}_{t}={\mathrm{tanh}}\left({W}_{C}\left[{h}_{t-1},{x}_{t}\right]+{b}_{C}\right), $$ (7) $$ {C}_{t}={f}_{t}{C}_{t-1}+{i}_{t}{\widetilde{C}}_{t}, $$ (8) $$ {h}_{t}={o}_{t}{\mathrm{tanh}}\left({C}_{t}\right), $$ (9) 式中,
$ {f}_{t} $ 、$ {i}_{t} $ 、$ {o}_{t} $ 分别为遗忘系数、输入系数、输出系数;$ {W}_{f} $ 、$ {W}_{i} $ 、$ {W}_{o} $ 分别对应各门控的权重矩阵;$ {b}_{f} $ 、$ {b}_{i} $ 、$ {b}_{o} $ 分别对应各门控的偏置向量;$ {x}_{t} $ 为当前时刻的输入信息;$ {\widetilde{C}}_{t} $ 为当前时刻的候选状态矩阵;$ {C}_{t} $ 、$ {C}_{t-1} $ 分别为新、旧记忆状态矩阵;$ {h}_{t} $ 、$ {h}_{t-1} $ 分别为当前、上一时刻的输出信息,其传入输出层后得到 LSTM 在当前时刻的输出。超参数是指在机器学习模型训练之前需要设置的参数,其值不能通过训练过程来自动学习,而是由研究人员根据经验或试验来进行选择,手动调整超参数往往是一项十分耗时且依赖专业经验的任务[18]。BO算法是一种十分有效的全局优化算法,其可以在较少次数的评估下得到复杂目标函数的最优解[19]。BO-LSTM的基本思想是将BO算法应用于LSTM超参数的调优之中,如图4中的虚线框所示,首先,随机抽取一组超参数用以初始化模型,并对模型训练结果进行评估,然后结合高斯过程、采集函数以及先前的超参数配置和评估结果,选择下一组最有可能提升训练效果的超参数配置,不断循环该过程直到满足预先设置的寻优结束条件。其具体计算公式如下:
$$ x^*=\mathrm{a}\mathrm{r}\mathrm{g}\underset{x\in \chi }{\min}f\left(x\right), $$ (10) 式中,
$ x^* $ 为所需的最优超参数组合,例如神经元个数、批尺寸等;$ \chi $ 为决策空间;$ f\left(x\right) $ 为待优化的目标函数。通过对目标函数值进行后验概率优化,并不断迭代以使目标函数值误差最小,后验概率公式如下:$$ P\left(A\right|B\left)\alpha P\right(B\left|A\right)P\left(A\right), $$ (11) 式中,
$ P\left(A\right) $ 为高斯分布;$ P\left(B\right|A) $ 为高斯回归过程;$ B $ 为已知数据;$ A $ 为未知数据;$ \alpha $ 为线性比例关系。本文构建台风浪波高智能预报模型的流程如图4所示。
3. 样本数据库构建
3.1 虚拟台风验证
按照2.2.1节中的步骤,利用TCWiSE模型构建了西北太平洋地区
1000 a内共18671 场虚拟台风。从生成的虚拟台风中随机抽取1128 场与实测历史台风进行比较,并对其进行定性分析。如图5a所示,虚拟台风起点与历史台风起点的分布总体保持一致。如图5b所示,虚拟台风终点与历史台风终点在海域上的分布基本保持一致,但是在陆域上虚拟台风终点要往内陆更加深入一些,这可能是因为模型设置的台风终止条件相比实际台风终止条件更加宽松。考虑到本文的研究区域为沿海地区,因此可以忽略内陆台风终点偏差对实验结果产生的影响。此外,如图6a所示在中国沿海岸线每隔100 km设置一共52个验证站点,在远海区域同样按照图中布置设置9个验证站点,采用模拟圆法筛选出对各验证站点造成影响的台风,通过统计每个站点处的台风参数对虚拟台风进行定量分析。模拟圆法是以研究点为圆心,划定一定的半径,当一个台风路径与模拟圆相交或是位于模拟圆内的时候,则认为该台风对该研究点造成影响[20]。Vickery 等[21]通过参数化实验,建议模拟圆半径采用250 km。基于该标准,筛选出对每个站点造成影响的历史台风和虚拟台风,并对其相关参数进行统计分析。统计结果如图6b和图6c所示,每个站点处历史台风和虚拟台风的年发生频数、近中心最大风速平均值以及近中心最大风速标准差均基本保持一致,这表明所构建的虚拟台风具有与历史台风相似的参数统计规律。
3.2 波浪模式验证
前人的研究已经表明SWAN波浪模式在浙江沿海地区具有较好的适用性[22–23],故本节对SWAN模拟波浪的效果仅进行简单的验证。以1909“利奇马”、2004“黑格比”和2211“轩岚诺”3场在浙江登陆的台风为例,利用其驱动SWAN波浪模式,并将模拟出的有效波高与实测数据进行对比,验证结果如图7所示。从图中可以看出,3场台风在不同测站处的验证结果均表现良好,这也证明了利用SWAN波浪模式为机器学习模型生成样本数据的可行性。
3.3 台风浪样本数据库构建
本文首先以舟山站为示例站点,构建与之对应的台风浪样本数据库。采用模拟圆法筛选出对舟山站造成影响的台风,设置模拟圆半径为250 km,基于该标准筛选出历史台风72场和虚拟台风
1156 场。利用筛选出的台风驱动SWAN波浪模式,得到舟山站在台风影响期间的有效波高值。当台风距离测站较远时,测站处的波高主要受常风场影响,而基于台风风场模型计算的测站波高值将与实测值不符,故考虑剔除波高样本中较低的波高值,筛选出有效波高值大于等于1.25 m的波高数据纳入样本库。此外,将台风路径信息、台风中心最低气压、台风近中心最大风速和舟山站处的气象信息线性插值为1 h间隔,与筛选后的波高数据共同组成台风浪样本数据库。4. 模型实验与分析
4.1 数据划分及评估指标
台风浪样本数据库建立完成后,首先对其进行数据划分,将虚拟台风对应的数据按照7∶3的比例划分为训练集和验证集,历史台风对应的数据则全部作为测试集。在模型的训练过程中,需要利用验证集对模型的输入因素和超参数进行评估选取,进而不断优化模型使其达到最佳的训练效果。
本文采用偏差(Bias)、均方根误差(Root Mean Square Error, RMSE)和决定系数(R-Square, R2)来评估机器学习模型的性能,各评估指标的计算公式如下:
$$ {\mathrm{Bias}}=\frac{1}{n}\sum_{i\ =\ 1}^{n}\left({{y}_{i}-\widehat{y}}_{i}\right), $$ (12) $$ {\mathrm{RMSE}}=\sqrt{\frac{1}{n}\sum _{i\ =\ 1}^{n}{\left({{y}_{i}-\widehat{y}}_{i}\right)}^{2}}, $$ (13) $$ {R}^{2}=1-\frac{\displaystyle\sum _{i\ =\ 1}^{n}{\left({y}_{i}-{\widehat{y}}_{i}\right)}^{2}}{\displaystyle\sum _{i\ =\ 1}^{n}{\left({y}_{i}-\bar{y}\right)}^{2}}, $$ (14) 式中,
$ n $ 为样本总数,$ {y}_{i} $ 为真实值,$ {\widehat{y}}_{i} $ 预测值,$ \bar{y} $ 为真实值的平均值。4.2 输入因素种类的选取
台风浪的生成主要受3类因素的影响,第一类是台风因素的影响,包括台风的位置、台风中心最低气压、台风近中心最大风速等;第二类是测站气象因素的影响,包括测站处的气压、测站处经向与纬向的风速等;第三类是其他固定因素的影响,包括测站的位置、海岸形状和海底地形等,这类因素通常变化较小,不考虑将其纳入模型的输入因素。此外,前时序波高(过去时段内带有时间序列的波高变化)在一定程度上可以刻画未来波高的演变趋势,因此需要将其考虑其中。
按照表1左栏将输入因素分为7个组次,对每个组次进行预报未来1 h的训练。假设当前时刻为t,利用t − n到t时段的输入因素来预报t + 1时刻的有效波高,本节中暂定前时序n为6。基于验证集评估其训练效果,各组次的RMSE如表1右栏所示。从表1中可以看出,单类影响因素中前时序波高对模型训练效果影响最大,起主导作用;而台风因素和测站气象因素的影响相对较小,起辅助作用;将所有影响因素全部输入时,模型的训练效果达到最佳。
表 1 输入因素不同种类条件下各组次的均方根误差Table 1. Root mean square errors of each group under different types of input factors输入因素种类 验证集RMSE/m 台风因素 0.878 测站气象因素 0.744 前时序波高 0.078 台风因素+测站气象因素 0.687 台风因素+前时序波高 0.066 测站气象因素+前时序波高 0.036 所有因素 0.025 4.3 输入因素前时序的选取
将所有的影响因素纳入考虑后,仍需对输入因素的前时序进行评估和选取。本文将输入因素的前时序按照前1 h到前12 h共分成12个组次,考虑到预报未来不同时长对于前时序的选取可能不同,故分别对预报未来1 h、3 h、6 h和12 h进行一共4 × 12组训练。基于验证集的评估结果如图8所示,可以发现预报未来1 h的组次中,前时序为1~4时,RMSE值随着前时序增加而明显下降,当前时序为5~12时,其RMSE值以很小的幅度上下波动,为了降低模型的训练成本,选取前时序4 h作为最佳方案。同样,预报未来3 h、6 h和12 h 3种情况具有和预报1 h相似的特点,分别选取其前时序为6 h、6 h和9 h,所有的选取方案用红色箭头标注于图8中。
4.4 基于贝叶斯优化的超参数选取
本文搭建的LSTM结构包含一个输入层、一个隐藏层和一个输出层,选取Tanh为激活函数、Adam为优化算法[24],利用贝叶斯优化算法对隐藏层的神经元个数、丢弃率、批尺寸和迭代次数进行评估选取。采用验证集上的RMSE作为评估标准,优化后的超参数组合如表2所示,可以发现最优超参数的分布范围较广,采用传统网格搜索法进行穷举遍历将耗费大量的时间精力,这也体现了贝叶斯优化算法在超参数选取方面的一定优势。
表 2 不同预报时长条件下LSTM最优超参数的选取方案Table 2. Selection schemes for optimal hyperparameters of LSTM under different forecast duration conditions超参数名称 寻优范围 选取方案 1 h 3 h 6 h 12 h 神经元个数 (2,512) 214 174 196 272 丢弃率 (0.01,0.2) 0.05 0.03 0.11 0.08 批尺寸 (8,32) 12 15 16 8 迭代次数 (10,100) 34 68 52 76 4.5 神经网络模型预报结果分析
结合最优的超参数组合对神经网络的结构进行设置,并利用测试集评估模型的预报效果。为了验证BO-LSTM神经网络模型在台风浪波高预报中的优势,本文同时将随机森林模型(Random Forest, RF)和反向传播神经网络(Back Propagation Neural Network, BPNN)应用于波高预报中,并将其预报结果与BO-LSTM的预报结果进行对比分析。
同样,利用贝叶斯优化算法对RF和BPNN进行超参数调优,以2106“烟花”、2211“轩岚诺”和2212“梅花”3场典型台风为例,不同机器学习模型对舟山站处有效波高的预报结果如图9所示。可以发现,当预报未来时长为1 h时,3个模型的预报结果均与SWAN的模拟结果相吻合,预报精度较高。当预报未来时长为3 h时和6 h时,LSTM的预报结果依旧保持较高精度,而RF和BPNN预报的可靠性则有所降低,对波高峰值的预报出现一定的偏差。当预报未来时长为12 h时,3个模型的预报精度均明显下降,但LSTM对于波高整体变化趋势和波高峰值的捕捉依旧表现良好,而RF和BPNN对于峰值的预报存在十分显著的高估或低估现象,其整体预报精度也相对较差。总结而言,当预报未来时长较短时,3个模型均有良好的预报性能,但随着预报未来时长的增加,LSTM模型相较于其他模型的优势开始不断扩大。
为了更加全面地评估BO-LSTM模型的预报性能,结合测试集上72场历史台风的相关数据,统计其在不同预报时长条件下的Bias、RMSE与R2,预报结果对应的各项评估指标及散点密度图如图10所示。由图可知,BO-LSTM模型预报未来1 h、3 h、6 h和12 h的有效波高值与SWAN模拟值之间的Bias分别为0.001 m、−0.013 m、0.018 m和−0.088 m,RMSE分别为0.017 m、0.092 m、0.194 m和0.425 m,R2分别为0.999、0.997、0.978和0.892,说明本文所构建的BO-LSTM模型可以很好地拟合SWAN波浪模式的模拟结果。
4.6 模型预见期的延长
在实际的台风浪预报场景中,不仅需要参考过去时段台风和波浪的演变趋势,还需结合气象台预报的未来台风风场,因此,考虑将未来时段的气象预报数据输入BO-LSTM模型中,进一步增强台风浪智能预报模型的预报性能。以12 h预见期为例,其具体实现方法如下:首先,提取未来12 h的台风路径预报数据,包括台风的经纬度、中心气压和最大风速等信息;然后,结合Holland台风模型得到未来时段站点处的气压和风速数据;最后,将过去时段站点处的有效波高数据、未来时段站点处的气压和风速数据、未来时段的台风路径数据作为BO-LSTM模型的输入,以12 h后站点处的有效波高值为输出,建立二者之间的非线性函数关系。
利用测试集对上述构建的BO-LSTM模型进行评估,其在不同预见期下的各项评估指标如表3所示,可以发现,由于风是驱动海浪运动的重要因素,添加了气象台预报的台风数据后,BO-LSTM模型的预报精度得到了有效的提升,并可以实现较高精度的24 h长时间预报,进一步提高了台风浪智能预报模型的应用价值。
表 3 不同预报方案条件下BO-LSTM模型在测试集上的Bias、RMSE和R2Table 3. Bias, RMSE and R2 of the BO-LSTM model on the test set under different forecasting schemes预见期 不添加预报风场 添加预报风场 Bias/m RMSE/m R2 Bias/m RMSE/m R2 1 h 0.001 0.017 0.999 0.001 0.012 0.999 3 h −0.013 0.092 0.997 0.009 0.064 0.998 6 h 0.018 0.194 0.978 0.014 0.122 0.986 12 h −0.088 0.425 0.892 −0.063 0.316 0.931 24 h / / / −0.102 0.494 0.855 5. 结论
本文首先基于TCWiSE模型构建西北太平洋地区大量的虚拟台风,利用SWAN波浪模式计算台风期间舟山站点处的有效波高,并建立对应的台风浪样本数据库;然后对BO-LSTM神经网络模型的输入因素和超参数进行评估和选取,结合样本数据库对其进行训练和测试;最后将预报的未来台风数据添加到台风浪智能预报模型的输入中,探索其更长的预见期。具体研究结论如下:
(1)所构建的虚拟台风与历史台风具有很好的相似性,可以为中国沿海地区台风浪波高智能预报模型的搭建提供充足的数据基础。
(2)所搭建的BO-LSTM模型可以快速实现单一站点处的台风浪波高智能预报,并具有媲美SWAN的预报精度,在长时间预报场景中,BO-LSTM模型的预报精度显著优于RF模型和BPNN模型。
(3)将预报的未来台风数据添加到BO-LSTM模型的输入中,进一步提高了台风浪智能预报模型的预报精度和预报未来时长,其预报未来24 h的Bias、RMSE和R2分别为−0.102 m、0.494 m和0.855。
综上所述,本文所构建的BO-LSTM模型在单点台风浪波高预报中可以很好的替代SWAN数值模式,且其更加具有时效性,基本满足应急抗台工作的需求。需要指出的是,本文目前只考虑了单一站点处台风浪的预报,针对台风期间二维波场的预报有待进一步研究。
-
表 1 输入因素不同种类条件下各组次的均方根误差
Tab. 1 Root mean square errors of each group under different types of input factors
输入因素种类 验证集RMSE/m 台风因素 0.878 测站气象因素 0.744 前时序波高 0.078 台风因素+测站气象因素 0.687 台风因素+前时序波高 0.066 测站气象因素+前时序波高 0.036 所有因素 0.025 表 2 不同预报时长条件下LSTM最优超参数的选取方案
Tab. 2 Selection schemes for optimal hyperparameters of LSTM under different forecast duration conditions
超参数名称 寻优范围 选取方案 1 h 3 h 6 h 12 h 神经元个数 (2,512) 214 174 196 272 丢弃率 (0.01,0.2) 0.05 0.03 0.11 0.08 批尺寸 (8,32) 12 15 16 8 迭代次数 (10,100) 34 68 52 76 表 3 不同预报方案条件下BO-LSTM模型在测试集上的Bias、RMSE和R2
Tab. 3 Bias, RMSE and R2 of the BO-LSTM model on the test set under different forecasting schemes
预见期 不添加预报风场 添加预报风场 Bias/m RMSE/m R2 Bias/m RMSE/m R2 1 h 0.001 0.017 0.999 0.001 0.012 0.999 3 h −0.013 0.092 0.997 0.009 0.064 0.998 6 h 0.018 0.194 0.978 0.014 0.122 0.986 12 h −0.088 0.425 0.892 −0.063 0.316 0.931 24 h / / / −0.102 0.494 0.855 -
[1] 陶爱峰, 沈至淳, 李硕, 等. 中国灾害性海浪研究进展[J]. 科技导报, 2018, 36(14): 26−34.Tao Aifeng, Shen Zhichun, Li Shuo, et al. Research progrecs for disastrous waves in China[J]. Science & Technology Review, 2018, 36(14): 26−34. [2] 屈远, 高志一, 蔡靖泽, 等. 数值模型和智能模型的海浪预报能力比较[J]. 海洋预报, 2022, 39(5): 17−26. doi: 10.11737/j.issn.1003-0239.2022.05.003Qu Yuan, Gao Zhiyi, Cai Jingze, et al. Comparison of wave prediction ability between numerical model and AI model[J]. Marine Forecasts, 2022, 39(5): 17−26. doi: 10.11737/j.issn.1003-0239.2022.05.003 [3] Wilson B W. Numerical prediction of ocean waves in the North Atlantic for December, 1959[J]. Deutsche Hydrografische Zeitschrift, 1965, 18(3): 114−130. doi: 10.1007/BF02333333 [4] 许富祥, 许林之. 海浪预报方法综述(二)[J]. 海洋预报, 1989, 6(4): 50−58.Xu Fuxiang, Xu Linzhi. Overview of wave forecasting methods (Ⅱ)[J]. Marine Forecasts, 1989, 6(4): 50−58. [5] 刘凡, 陆小敏, 徐丹, 等. 海浪预报方法研究进展[J]. 河海大学学报(自然科学版), 2021, 49(5): 387−393.Liu Fan, Lu Xiaomin, Xu Dan, et al. Research progress of ocean waves forecasting method[J]. Journal of Hohai University (Natural Sciences), 2021, 49(5): 387−393. [6] Fan Shuntao, Xiao Nianhao, Dong Sheng. A novel model to predict significant wave height based on long short-term memory network[J]. Ocean Engineering, 2020, 205: 107298. doi: 10.1016/j.oceaneng.2020.107298 [7] Zhou Shuyi, Xie Wenhong, Lu Yuxiang, et al. ConvLSTM-based wave forecasts in the South and East China Seas[J]. Frontiers in Marine Science, 2021, 8: 680079. doi: 10.3389/fmars.2021.680079 [8] Gao Zhiyi, Liu Xing, Yv Fujiang, et al. Learning wave fields evolution in North West Pacific with deep neural networks[J]. Applied Ocean Research, 2023, 130: 103393. doi: 10.1016/j.apor.2022.103393 [9] Pan Yi, Chen Yongping, Li Jiangxia, et al. Improvement of wind field hindcasts for tropical cyclones[J]. Water Science and Engineering, 2016, 9(1): 58−66. doi: 10.1016/j.wse.2016.02.002 [10] Ying Ming, Zhang Wei, Yu Hui, et al. An overview of the China meteorological administration tropical cyclone database[J]. Journal of Atmospheric and Oceanic Technology, 2014, 31(2): 287−301. doi: 10.1175/JTECH-D-12-00119.1 [11] Lu Xiaoqin, Yu Hui, Ying Ming, et al. Western North Pacific tropical cyclone database created by the China meteorological administration[J]. Advances in Atmospheric Sciences, 2021, 38(4): 690−699. doi: 10.1007/s00376-020-0211-7 [12] Nederhoff K, Hoek J, Leijnse T, et al. Simulating synthetic tropical cyclone tracks for statistically reliable wind and pressure estimations[J]. Natural Hazards and Earth System Sciences, 2021, 21(3): 861−878. doi: 10.5194/nhess-21-861-2021 [13] Booij N, Ris C R, Holthuijsen H L. A third-generation wave model for coastal regions: 1. Model description and validation[J]. Journal of Geophysical Research: Oceans, 1999, 104(C4): 7649−7666. doi: 10.1029/98JC02622 [14] Holland G J. An analytic model of the wind and pressure profiles in hurricanes[J]. Monthly Weather Review, 1980, 108(8): 1212−1218. doi: 10.1175/1520-0493(1980)108<1212:AAMOTW>2.0.CO;2 [15] 杨万康, 尹宝树, 伊小飞, 等. 基于Holland风场的台风浪数值计算[J]. 水利水运工程学报, 2017(4): 28−34.Yang Wankang, Yin Baoshu, Yi Xiaofei, et al. Numerical calculation and research of typhoon waves based on Holland wind field[J]. Hydro-Science and Engineering, 2017(4): 28−34. [16] 马秀玲, 魏来. 基于Holland台风模型及三重嵌套海浪模式的台风浪数值模拟研究[J]. 海洋与湖沼, 2024, 55(1): 51−64.Ma Xiuling, Wei Lai. Numerical simulation of typhoon waves based on the Holland typhoon model and triple nested wave pattern[J]. Oceanologia et Limnologia Sinica, 2024, 55(1): 51−64. [17] Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735−1780. doi: 10.1162/neco.1997.9.8.1735 [18] 李亚茹, 张宇来, 王佳晨. 面向超参数估计的贝叶斯优化方法综述[J]. 计算机科学, 2022, 49(S1): 86−92. doi: 10.11896/jsjkx.210300208Li Yaru, Zhang Yulai, Wang Jiachen. Survey on Bayesian optimization methods for hyper-parameter tuning[J]. Computer Science, 2022, 49(S1): 86−92. doi: 10.11896/jsjkx.210300208 [19] Shahriari B, Swersky K, Wang Ziyu, et al. Taking the human out of the loop: a review of Bayesian optimization[J]. Proceedings of the IEEE, 2016, 104(1): 148−175. doi: 10.1109/JPROC.2015.2494218 [20] Georgiou P N. Design wind speeds in tropical cyclone-prone regions[D]. London, Canada: Western University, 1986. [21] Vickery P J, Wadhera D, Twisdale L A, et al. U. S. Hurricane wind speed risk and uncertainty[J]. Journal of Structural Engineering, 2009, 135(3): 301−320. doi: 10.1061/(ASCE)0733-9445(2009)135:3(301) [22] 郑桥. 浙江近海典型台风浪和寒潮浪的精细化数值模拟[D]. 杭州: 浙江大学, 2019.Zheng Qiao. Numerical simulation of typical typhoon waves and cold waves in Zhejiang adjacent seas with refined grids[D]. Hangzhou: Zhejiang University, 2019. [23] 季余, 朱业, 李莉, 等. 浙江沿海台风浪模式的参数适应性研究[J]. 海洋预报, 2023, 40(2): 22−31. doi: 10.11737/j.issn.1003-0239.2023.02.003Ji Yu, Zhu Ye, Li Li, et al. Study on the parameters adaptability of typhoon wave model in Zhejiang coastal area[J]. Marine Forecasts, 2023, 40(2): 22−31. doi: 10.11737/j.issn.1003-0239.2023.02.003 [24] 邱锡鹏. 神经网络与深度学习[M]. 北京: 机械工业出版社, 2020.Qiu Xipeng. Neural Networks and Deep Learning[M]. Beijing: China Machine Press, 2020. -