您的当前位置:首页正文

ECMWF集合预报产品在广西暴雨预报中的释用

来源:九壹网
第29卷第3期 2O18年5月 应用气象学报 JOURNAL OF APPI IED METEOROLOGICAL SCIENCE V0l|29,No.3 Mav 2O18 赵华生,黄小燕,黄颖.ECMWF集合预报产品在广西暴雨预报中的释用.应用气象学报,2018,29(3):344—353 DOI:10.11898/1001-7313.2O180308 ECMWF集合预报产品在广西暴雨预报中的释用 赵华生 黄小燕 黄 颖 (广西壮族自治区气象减灾研究所,南宁530022) 摘 要 基于最大相关最小冗余度算法和随机森林回归算法,该文提出一种对欧洲中期天气预报中心(ECMWF)集合 预报产品进行暴雨预报的释用方法。该方法采用最大相关最小冗余度算法,对ECMWF集合预报的51个成员进 行筛选,选取若干个与预报对象相关性最大、相互间冗余度最小的成员作为随机森林回归算法的输入因子。利用 ECMWF集合预报降水量平均值对建模样本进行分类,使预报模型的建模样本更具有针对性。通过2012年4 月 2O15年12月的交叉独立样本试验预报和2016年1 9月的业务预报试验的统计结果表明:该释用方法的暴 雨预报TS和ETS评分,均比采用ECMWF集合预报产品51个成员降水量预报进行插值后取平均值的释用方法 分别提高了0.07和0.05以上,显示了较好的数值预报产品释用效果。 关键词:最大相关最小冗余度算法;随机森林回归算法;释用 on forecast,QPF)的释用方法研究_2 ],包括强降水 引 言 随着社会的发展,各行各业对气象服务的需求 越来越多,要求也越来越高。同时,随着高时空分辨 率的数值预报模式在预报业务中的使用,人们希望 气象部门能提供更为准确的天气预报产品。然而, 受模式误差、输出误差、模式稳定性以及预报员的主 观分析等原因影响,如果直接使用数值预报模式中 的客观定量预报释用方法研究,取得了较多的研究 成果,并在实际预报业务中得到应用。如David 等_7 利用分级技术从NCEP多模式短期集合预报 系统中输出较可靠的3 h概率定量降水预报 (PQPF),并对此进行分析发现分级技术对降水事 件能提供更多预报技巧和可靠性;赵声蓉等 以多 个模式的降水量预报产品作为神经网络的预报因 子,利用神经网络方法建立一种数值预报产品释用 的输出结果进行预报,其准确率相对较低。为了得 到客观化和定量化的预报效果,目前,对数值模式产 品进行客观订正的释用是解决该问题的主要方法之 一的定量降水预报模型,预报效果提高明显;唐晓文 等_1叩根据深厚湿对流系统长时间维持将产生强降 水这一配料法的预报原理以及中国不同区域的天气 。实践证明:通过对数值预报产品的释用,其预报 特点,选取对强降水(不小于25 mm·d )有显著 影响的4类因子(水汽因子、动力因子、不稳定因子 能力比模式的直接输出预报有明显提高 ]。同时, 由于暴雨是我国最重要气象灾害之一,开展客观定 量的数值预报产品暴雨预报释用方法研究具有重要 意义。 及热力因子),在一定的物理条件约束下,利用经验 和统计相结合的方法建立配料综合指数与强降水之 间的关系;Jerome等 利用美国国家气象局气象 发展研究室开发的高分辨率全球预报系统(Global Forecasting System,GFS)得到美国本土的4 km格 到目前为止,很多学者开展了利用数值预报产 品进行客观定量降水预报(quantitative precipitati— 201 7 07 25收到,2O18—01 29收到再改稿。 资助项目:国家自然科学基金项目(41575051,61562008,41765002),广西重点基金项目(2017GXNSFDA198030),广西青年基金项目(2014G— XNSFBA1182l1) *邮箱:2()(]6zha。huasheng@163.com 第3期 赵华生等:ECMWF集合预报产品在广西暴雨预报中的释用 345 距的高分辨率MOS定量降水预报;孙靖等口。 利用 分等级消除偏差法,并采用混合训练期和6O d滑动 训练期方案,对2012年欧洲中期天气预报中心(E— CMWF)数值模式夏季1--5 d的降水预报进行订正 试验,试验结果表明:该方法对25 mm·d 以上降 水预报的ETS评分提高明显。 从上述国内外研究现状可以看到,基于数值预 报产品释用的客观定量降水预报方法是目前短期客 观定量预报的重要发展方向。然而,目前国内外还 没有一种成熟、有效并得到预报业务技术人员普遍 认同的数值预报产品释用方法。为此,本文尝试提 出一种基于最大相关最小冗余度(maximum rele— vance minimum redundancy,MRMR)算法和随机 森林回归算法(random forest regression,RFR)相 结合的数值预报产品释用方法。该方法以广西89 个站点的降水作为预报对象,采用最大相关最小冗 余度算法从ECMWF集合预报的51个成员筛选出 若干个成员,这些成员与预报对象具有相关性最大、 成员间冗余度最小的优点。将提取出的预报成员作 为随机森林回归算法的输入因子进行释用。 1资料与方法 1.1 资 料 本文所用资料是ECMWF集合预报模式的逐 日08:00(北京时,下同)和20:O0的24 h和48 h降 水量预报产品(格距为0.5。×0.5。,水平范围为21。 ~26.25。N,104.75。~112。E);选取试验样本时段为 2012年4月一2016年9月,共2176个样本(去除数 据缺失样本),其中2012年4月一2015年12月为 建模样本,2016年1—9月(共526个样本)为独立 样本进行预报试验。 1.2 方 法 统计预报中,有两方面因素影响其预报效果:一 是预报因子的选取,即所选取的模型预报因子与预 报对象之间的相关性强弱以及预报因子间的复共线 性大小问题;二是预报模型本身的问题,即所选取模 型的拟合能力和泛化性能强弱。为此,本文首先采 用最大相关最小冗余度(MRMR)算法,从多个预报 因子中选取与预报对象相关性大而它们之间的预报 信息重叠少(复共线性小)的若干个预报因子作为预 报模型的输入。其次,在预报模型的构建上,考虑采 用具有泛化能力和抗噪声能力强、训练时间短且不 容易陷入过拟合的随机森林回归算法。 本文提出的基于最大相关最小冗余度算法和随 机森林回归算法相结合的数值模式预报释用方法主 要步骤如下: ①采用三次多项式插值方法将每个ECMWF 集合预报成员插值到站点上。 ②利用ECMwF集合预报成员插值的平均 值,对预报对象的历史样本序列进行分类。 ③将分类后的预报对象样本对应的因子矩阵 采用最大相关和最小冗余度算法,对每个站点的 ECMWF集合预报51个成员进行筛选。 ④将步骤③选出的预报成员作为随机森林算 法的模型输入进行预报建模,并输出预报结果。 1.2.1最大相关最小冗余度算法 预报因子是统计预报模型的重要组成部分,预 报因子的选取直接影响预报效果。本文将ECMWF 集合预报产品51个成员的输出值作为预报模型的 输入因子,成员之间的相关性和冗余性会影响预报 模型的预报能力,为此本文尝试采用MRMR算法 对集合预报的成员进行筛选。 MRMR算法是信息论中典型的特征降维算 法l_1 ,其主要思想是从特征空问中寻找与目标类别 相关性最大而相互之间冗余性却最少的m个特 征口 ,他们之间的相关性和冗余性利用互信息_】 衡 量。互信息用于衡量两个随机变量之间的相互约束 程度。对于给定s一{ l i一1,…,m}为特征集合和 目标类别y,则特征集合s中的特征与目标类别y 的最大相关度以及度量特征集合s中各特征间的互 相关度分别为式(1)和式(2)。 1一 maxD(s,y),D—  1I > (1z ,y); (1) s 1 一 minR(S),R一 ( )。 (2) l  lxi, ∈S Peng等_1 定义算子(D,R)结合相关性因子D 和冗余性因子R,即将式(1)减式(2)进行组合,从而 得到最大相关性最小冗余度准则(MRMR): max,(D,R)一D(S,y)一R(S)。 (3) 1.2.2随机森林回归算法 统计预报模型构建方法的选取,对释用效果也 有直接影响,本文采用多决策树组合而成的随机森 林回归算法(random forest regression,RFR)进行 构建预报模型,RFR算法是由Breiman于2001年 提出的一种非线性统计方法_1 ,该算法具有抗噪声 346 应用气象学报 第29卷 强、预报结果稳定的优点。RFR是利用自举法从原 医学等众多领域得到广泛应用口 ]。然而,该方法 在降水预测中的应用报道较为少见。为此,本文尝 始样本中抽取多个训练样本子集,对每个样本子集 分别进行决策树建模。进一步通过组合多棵决策树 进行预测,并通过取平均值得到最终预测结果_1引, 其本质与气象上的集合预报思想相近,是将多棵决 试采用该方法进行数值模式的降水预报产品进行释 用。 RFR算法是通过自举法抽样技术,由随机向量 0。(即回归决策树)生长形成(h(X,0 ),i=1,…,是) 策树建模得到的预测结果进行集成。 随机森林回归算法同时还具有计算速度快、泛 的组合模型。预测变量是一个数值型变量,与其分 类模型不同,其预测值是通过k棵回归决策树的预 测结果取平均值得到的。RFR算法实现见图1。 化性能好以及参数少等优点,且不容易出现人工神 经网络的过拟合现象。目前该方法在农业、水文和 图l RFR算法流程图 Fig.1 RFR algorithm flow chart 报时次为08:O0和2O:00)降水量作为预报对象,重 2 建模试验 本文以广西89个气象站未来24 h(每日2个预 点研究暴雨以上量级的降水预报。研究区域和站点 分布如图2所示。 图2研究区域和站点分布 Fig.2 The target areg and station distribution 第3期 赵华生等:ECMWF集合预报产品在广西暴雨预报中的释用 347 2.1 单站暴雨集合预报建模样本及预报因子处理 林回归模型算法建立集合预报模型。 ⑦将步骤⑤选出的因子(成员)对应的预报样 本代入步骤⑥训练好的预报模型中,得到对该站未 来24 h的降水量预报。 2.2结果分析 经过统计分析,2012年4月一2O16年9月共 2176个样本中(去除资料缺失样本),广西89个基 本气象站24 h(统计时段包含当日08:O0一次日 08:O0和前日20:O0一当日20:00)内出现1个站以 上、降水量达到暴雨以上的有4775个站次。本文的 研究对象24 h降水量达到暴雨以上量级的情况比 在进行建模试验时,为了能够更好地了解本文 提出方法的释用能力,在此采取交叉检验法,即将 2012年4月一2015年12月的样本作为独立样本进 行与实际预报相同的独立预报试验,对2016年1— 较频繁。为提高暴雨预报的准确率,在进行单站暴 雨集合预报建模时,对模型的建模样本采取分类处 理方式,具体建模步骤如下: 9月进行业务预报试验。在进行试验计算前,要先 确定出2.1节计算步骤中的几个阈值参数(n,a, )。 参数”用于选取若干个集合预报成员作为模型的预 报因子参与最后的训练计算,根据文献[22]的研究 结果,参与集合预报计算的成员,其数量控制在8~ 1o个比较合适。本文先设定参数 为10,分析另外 两个阈值参数a和口不同取值时对预报模型的影响 情况。同时,为了能够将预报结果与数值预报产品 进行比较,本文采用常用的多项式插值方法将EC— MWF集合预报成员的格点资料插值到站点上,并 将所有成员插值到站点后取其平均值的预报方法称 为AVI(average value of the interpolation)。表1 ①对ECMWF集合预报的每个成员(共51个 成员),利用前一日48 h累积降水量预报场减去 24 h累积降水量预报场,从而获得该成员当日的未 来24 h降水量预报场R。 。 ②采用多项式插值方法,将降水量预报场R。 插值到89个气象站。此时,每个预报对象(气象站) 都对应有51个预报因子(51个ECMWF集合预报 成员的插值),记为 。 ③对于第k(足一1,…,89)个预报对象l,(气象 站),如果该站点的F5 平均值大于a mrn,则在预报 对象y的历史样本序列(其样本序号记为 )中,选 出降水量大于 n'11"n的样本序号集Q (Q Q)。 若该站点的F 平均值小于a mm,则令Q 一 。 ④利用步骤③得到的预报对象y的建模样本 序号集.Q ,可得到与之对应的由F 组成的因子矩 阵 和预报量序列l, 。 ⑤将s 和y 带入MRMR算法,求出这51个 为本文提出的新方法(称为MRMR—RFR)预报结果 与相应预报时段的ECMWF集合预报51个成员插 值到站点后取其平均值(AVI方法)的TS评分,表 1中TS评分越高,表示对应方法预报的准确性越 高。考虑到ETS评分方法可有效去除随机降水概 率对评分的影响,同时也可以避免使用气候概率的 情况,本文也对试验预报结果采用ETS评分进行对 比。 因子中(集合预报成员)与预报量y 相关性最大和 冗余度最小的 个因子(成员)。 ⑥以步骤⑤选出的s 和y 为基础,采用随机森 表1 2012--2015年暴雨以上量级降水交叉独立预报TS评分 Table 1 TS of cross independent sample test forecast of rainstorm from 2012 to 2015 2Ol2 2O13 2O14 0.12 0.11 0.11 O.11 0.10 0.11 0.15 0.13 0.17 0.14 0.12 O.12 0.14 O.12 0.14 0.13 0.13 0.14 0.11 0.12 0.12 0.10 0.07 0.09 0.08 0.06 0.06 0.08 0.07 0.06 2015 0.12 O.11 对数值模式产品的解释应用,是在承认其具有 一降水的情况。同时,由于模式预报结果与实际降水 量差异存在,一般设定阈值参数 < 。从表1的统 计结果中可以看到:两种评分方法的统计结果中, 定预报能力的基础上进行的。因此,假设当集合 预报的成员插值平均达到15 mm以上(阈值a取 15 mm以上)时,实况降水量才可能出现暴雨以上 ETS评分整体上略低于TS评分,这是因为ETS评 348 应用气象学报 第29卷 分方法对空报和漏报都有惩罚。相比AVI方法的 ETS评分较TS评分偏低幅度,MRMR—RFR释用 方法ETS评分偏低幅度更大一些,说明MRMR— RFR释用方法空报的次数多于AVI方法。②本文 2012年4月一2015年12月的交叉独立预报中,其 暴雨TS评分比AVI方法分别提高了0.08,0.04, 0.09和0.08,而相应的ETS评分方法也比AVI方 法的ETS评分分别提高了0.06,0.04,0.07和 0.06。 选取的3组阈值参数,其预报结果在暴雨以上量级 降水预报(降水量不小于50 mm)的TS和ETS评 由上述的分析可知,参数a和 在一定范围内 分相差不大,说明这两个阈值参数对其预报能力的 敏感性不明显,只要取值在一定范围之内,MRMR— RFR释用方法TS和ETS评分均高于AVI方法的 进行取值,MRMR—RFR方法的预报效果稳定。为 了进一步考察参数,z取值对预报模型稳定性的影 响,首先固定参数a和p的取值(取TS,ETS评分最 高的参数组合:a一20 mm, 一15 ram)选取不同的 值进行上述同样本的试验分析,其中 的取值分别 尝试取9个和11个(8--10个的附近l_2。]),其统计结 果见表2。 预报结果,这其中提高幅度最大的是a取20 mm, 取15 mITl时,即当集合预报51个成员的插值平均 预报降水量达到20 mm以上时,选取实况降水量大 于15 mm的样本进行建模,该组参数的预报结果在 表2不同参数n下2012--2015年暴雨交叉独立预报TS评分 Table 2 TS of cross independent sample test forecast of rainstorm under different n from 2012 to 2015 0.15 0.13 0.14 O.12 0.13 0.12 0.14 0.11 0.12 O.11 0.12 0.14 0.14 0.15 O.12 O.16 分析表2可知,MRMR—RFR方法在3个不同咒 取值情况下,该释用方法交叉独立样本的试验结果 4月 2O15年12月试验结果中TS,ETS评分相对 较高的参数组合(n一10,d一20, 一15),对2016年 l一9月进行业务预报试验。预报结果见表3。 由表3可知,本文提出的MRMR—RFR释用方 法在的逐次独立样本预报检验中,9个月TS,ETS 评分全部超过0分,并且在出现暴雨站次达到100 个以上的4 8月,该释用方法的TS,ETS评分均 中,3组参数组合的TS,ETS评分互有高低,统计结 果相对比较稳定。由此可知,参数 在一定范围的 取值,MRMR—RFR释用方法的预报结果也保持稳 定。 为了进一步检验模型的预报性能,采用2012年 表3 2016年1—9月单站暴雨以上量级降水业务预报TS。ETS评分 Table 3 TS and ETS of single-station forecast of rainstorm using different methods from Jan 2016 to Sep 2016 M月份 月份 (n一 ,a一 一10 2 0 ,口= ) 15, ETS O.00 0.00 降水量不小于 50 mm站次 0.00 0.06 0.03 O.13 0.06 0.01 0.18 0.00 0.00 0.05 0.02 0.11 0.03 0.00 O.15 0.00 O.O8 0.06 第3期 赵华生等:ECMWF集合预报产品 J'‘ 暴『:f:j预报L}l的释刚 叫显高于AVI方法。统计可知,MRMR RFR释用 非台风类的一般性暴雨强降水过程,共有27个气象 站降水量达到50 nlI"I1以上, 4为该次过程 种方 法预报对比。 由图3叮以看到,埘于8户j 2口2o:O0 3 r_I 方法在5 8月TS,ETS评分均高于0.10。该释用 方法1 9月平均的TS,ETS评分比AVI方法评分 分另0提高0.07_干口0.05。 本文选取2016年8月两次暴雨预报情况进行 分析。一次过程选取受2016年第4号台风妮娟影 响而造成的大范剧暴雨,具体时段为20l6年8月2 口20:O0 3日2o:O0,共有30个气象站降水量达 到50 mFll以上,图3为两种方法预报对比。另一次 过程选取2Ol6年8月l2日2O:∞ 13日20:O0的 2O:()()预报中,MRMR—RFR释川方法l币IJ AVI方法 预报降水量大于50 ITIi21的落 拱本亘合,覆盖厂全 区的大部分地区,然而,MRMR—RFR释用方法比 AVI方法住广两西南部和东南部这两个区域更接 近实况。 图3 201 6年8月2 El 20:00--3 El 20:00 2{h降水实况 j预报 (a)实况,(b)MRMR—RFR释用方法预报.(c)AVI方法预报 Fig.3()bservation and prediction of Ihe case from 2000 I¨、2 Aug tO 2000 BT 3 ALlg in 201 6 (a)observation,(I))prediction of MRMR~RFR.(c)prediction of AVI 第29巷 l08 109 110 续图3 由 4町知,对于8月12日2O:00 13日 集合预报产品释用。其预报技巧 大郝分 况下为 2O:()()AVI方法预报出该降水过程的雨带,但所有 正技巧,可以一定程度上提高ECMWF集合坝报的 站降水量均未超过50 Film。而实况有27个站降水 暴雨预报能力。这与本文采用的 f选取办法、建 垃超过50 ITITII。MRMR—RFR释用方法预报出13 模样本分类以及预报模型建立的 ‘法仃父,通过这 个站降水量超过5O mill,卒报1 6个站,漏报l4个 些处理,既可以使模型更加专注于 的降水过 .同 站,TS评分为0.30(ETS评分为0.16)。即 时义能在预报强降水的建模样本· 除部分降水量 MRMR—RFR释用方法具有 预报技巧。 很小或较小的样本.减少建模样本fl,的噪,l ( 扰)。 综J 所述,MRMR RFR释州方法对ECMWF 图4 2()1 6 q 8』j 1 2¨2O:()() 1 3日2():00 24 h降水实况和预报 (a)实况,(b)MRMR RFR释用方法预报,(C)AVI厅法预报 Fig.4()bserwllion aild prediction of the case from 2000 BT l 2 Aug to 2000 I{T 1 3 (a)obsc rvaIion.(I】)prediction of MRMR RFR,(c)prediction of AVI 第3{ 赵华生等:ECMWF集合预报产品往广西暴雨颅报中的释JH 35l 26。N 引 皋、 105 lO6 l07 lO8 l09 110 111 112。E ’ 26。N .. i i ● J■● ● 一 ● 。 ●I‘I l1  2扎O 2蓦.9 . ‘ 一一 西l9. 』 nn 一 3f.8 A . 2 …”’1 r 33 4 撕 6 .。 23 曼 l【】() —— i ·9 3j5 .搿 。 00 1 , ■ 2S .5 “1-- n 1 一 lO5 l06 107 109 1l0 l】1 l】2 E 本文提出的对数值预报产品的MRMR—RFR 3 小 结 1)采用最大相关最小冗余度的互信息技术进 行因子选取,可以提高人选因子的预报信息。同时入 选因子与预报量具有最大的相关性。构建模型时采 用可调参数极少、计算速度快日|有很好的非线性拟 合能力和泛化性能的随机森林算法。 2)独立样本预报试验表明:本文提出的 释用方法较为简单,便于预报人员往业务巾使用。 参考文献 刘还珠,赵声蓉,陆志蔷。等。国家气象中心气象要素的客观预 报 M()s系统.应用 象学报,2O0 i,l 5(2):181 1 91. 毕宝贵.代刊.王毅.等.定最降水预报技术进展.应用气象学 报.201 6,27(5):534 5l9. 岳彩 .寿亦萱,寿绍文.等.湿Q矢皱释用技术及其存定量 降水预报中的应用.应用气象学报,20O7,18(5):666 675. L荣.1 建捷,梁丰,等. 度分解技术红定璇降水』『缶近预报检 验中的应用.应用气象学报.2O10.21(5):j35 544. MRMR—RFR释用方法相对于ECMWF集合预报 产品插值方法(AVI方法),能更好地判断暴雨的落 区及落区范围大小。 杨成荫,王汉杰.周林.等.基于全场信息的数值预报产, 释用 352 方法研究.应用气象学报,2009,20(2):232—239. 应用气象学报 第29卷 microarray gene expression data.Journal of Bioinformatics and Computational Biology,2005,3(2):185 205. ng C.Feature selection based Oil mutual [15] Peng H,Long F H,Diinformation:Criteria of max dependency,max-relevance,and min-redundancy.¨ EE Transactions on Pattern Analysis and E6] 刘长征,杜良敏,柯宗建,等.国家气候中心多模式解释应用集 成预测.应用气象学报,2013,24(6):677—685. d J S,Nusrat Y.Reliable probabilistic quantitative precip— [7] Daviitation forecasts from a short -range ensemble forecasting sys—— tern.Wea Forecasting,2007,22(1):3-17. Machine Intelligence,2005,27(8):1226—1238.  Y,David J S.Reliable probabilistic quantitative precip— [83 Nusratitation forecasts from a short—-range ensemble forecasting sys—— n M A,Jia X,Pickering M.Subspace detectionusing a [16] Hossaimutual information measure for hyperspectral image classifi— cation.jEEE on Geoscience and Remote Sensing Letters, tern during the 2005/06 cool season.Mont Wea Rev,2008,136 (6):2157-2172. [9] 赵声蓉,裴海瑛.客观定量预报中降水的预处理.应用气象学 报,2007,18(1):21—28. [10] 唐晓文,汤剑平,张小玲.基于业务中尺度模式的配料法强降 水定量预报.南京大学学报(自然科学版),2O10,46(3):277— 283. [11] Jerome P C,Frederick G S.Regionalization in fine~grid GFS MOS 6-h quantitative precipitation forecasts.Mon Wea Rev. 2011,139(1):24—38. [1el Jerome P C,Frederick G S.High-resolution OFS-based MOS quantitative precipitation forecasts on a 4-km grid.Mon Wea Rev,2011,139(1):39—68. [13] 孙靖,程光光,张小玲.一种改进的数值预报降水偏差订正方 法及应用.应用气象学报,2015,26(2):173—184. [i4] Ding C.Peng H.Minimum redundancy feature seleetion from 2014,2(11):424—428. [17] Breiman L.Random forests.Machine Learning,200 1,45(1): 5—32. [18] 方匡南.随机森林组合预测理论及其在金融中的应用.厦门: 厦门大学出版社,2O12. [19] 邹亮,黄琼,李骜,等.基于随机森林和富集分析的阿尔茨海默 症GWA研究.中国科学(生命科学),2012,42(8):639—647. [2O] 李建更,高志坤.随机森林:一种重要的肿瘤特征基因选择法. 生物物理学报,2009,25(1):51 56. [21] 方匡南,朱建平,谢邦昌.基于随机森林方法的基金收益率方 向预测与交易策略研究.经济经纬,2010(2):6卜65. [22] Du J,Mullen S L,Sanders F.Short range ensemble{orecas~ ting of quantitative precipitation.Mon Wea Rev,1997,125: 2427—2459. 第3期 赵华生等:ECMWF集合预报产品在广西暴雨预报中的释用 353 Application of ECMWF Ensemble Forecast Products to Rainstorm Forecast in Guangxi Zhao H uasheng H uang Xiaoyan H uang Ying (Guangxi Research Institute of Meteorological Disasters Mitigation,Nanning 530022) Abstract Using the maximal correlation minimum redundancy algorithm and random forest regression algo— rithm,a rainstorm interpretation forecasting method with numerical prediction products is proposed based on the ensemble prediction system of European Center for Medium—Range Weather Forecasts(ECMWF). The precipitation forecast of 5 1 members in ECMWF ensemble prediction system are interpolated to weath— er stations,and then,the maximum related minimum redundancy algorithm is used to filter ensemble members.Finally,several member interpolations that have the highest correlation with the predictand and the 1east redundancy with each other are selected as input factors of the random forest regression algo— rithm.Furthemore,in order to make modeling samples of the forecast mode1 more pertinence,the model— ing samples are classified using the mean rainfall value of ECMWF ensemble prediction products of 5 1 members.That is,when the mean precipitation using ECMWF ensemble prediction products at a certain station is relatively large and there is a possibility of precipitation above the storm level,only historical samples containing a large amount of precipitation are selected as modeling samples of the forecasting rood— e1.Therefore,the forecasting model reduces the influence of the sunny and wet weather samples on the noise of the forecasting model,so that forecasting model focuses on the training of large precipitation sam~ pies.When the mean value of the predicted ECMWF ensemble precipitation at a certain weather station is small,all samples of the weather station(including samples of sunny days and heavy precipitation)are modeled so that the training of the forecasting model can reconcile the heavy rain samples and thus as far as possible to avoid the rainstorm of weather station omissions reported.This method is applied to 89 stations in Guangxi。and a 4-year cross—independent sample test forecast for 2012—2015 is carried out.The busi— ness test forecast is carried out in 201 6.In the 4-year cross—independent sample test results,rainstorm TS and ETS scores of this method are all improved by 0.04—0.09 and 0.04—0.07,respectively,compared with the average value after interpolation using the precipitation forecast of 5 1 members in ECMWF en— semble prediction products。Results of the business trial in 2016 show that TS and ETS scores of the meth— od for interpretation rainstorms TS and ETS scores are improved by 0.07 and 0.05,respectively,tom— pared with average values of pre—interpolation methods for the precipitation forecast of 5 1 members in EC— MWF ensemble prediction products.It shows that the proposed rainstorm precipitation method of ECM— WF ensemble prediction products has advantageous effects on forecasting and practical application fore— cast. Key words:maximum relevance minimum redundancy;random forest regression;interpretation 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top