知識服務 / 電子報 / TCCIP 電子報第037期
常問問題 名詞小櫥窗 TCCIP最新消息 氣候變遷新聞
2020/05/01 臺灣氣候變遷推估資訊與調適知識平台電子報037期 803 點閱人次
封面故事

臺灣日降雨網格化觀測資料之建置與驗證

楊承道 專案佐理研究員(TCCIP)、翁叔平教授(師大地理系)

 

目的

為因應全球氣候變遷下威脅日趨加劇的區域極端天候帶來的社經衝擊,科技部政策推動的臺灣氣候變遷推估資訊與調適知識平台計畫(Taiwan Climate Change Projection Information and Adaptation Knowledge Platform; TCCIP)的任務之一就是蒐集整合散佈在交通部氣象局、經濟部水利署、行政院環保署、行政院農業委員會農業試驗所和林業試驗所等單位的測站資料,將測站點的資料面化為網格資料,建立臺灣的氣候變遷資料庫。建置長期且高時空解析度的歷史觀測網格資料,除了可偵測氣候變遷訊號並提出預警[1],強化診斷天候事件之時空演化的能力、亦可應用於區域氣候模式(RCM)調校模式偏差[4]、訓練統計降尺度模型[11],以及量化災害的衝擊評估[6][3],更能進一步提供不同研究領域,例如水文災害、公共衛生、植物生態等相關研究的需求。
 
圖1為從各單位蒐集的降雨測站在臺灣地區的空間分佈,測站總數約兩千多站,分散在臺灣各地,西部平原的測站密度比起中央山脈、雪山山脈,相對高出許多,尤其是中央山脈南端的測站數量最少。
圖1:各單位測站的空間分佈。氣象局局屬、民航局測站(黑色,41站);自動氣象站(紅色,651站);水利署水文暨農業測站(綠色,1337站);環保署空品測站(黃色,78站);林業試驗所測站(紫色,14站)。
 
 
 

網格化方法簡介

    在日降雨網格化資料庫的建置過程中,因測站降水資料同時具備無雨日和有雨日的混合性質[7],大部份的統計模型無法處理混合分佈,所以通常分兩階段進行,第一階段先模擬降水是否發生,第二階段再模擬其雨量。例如國內研究社群常用的皮爾森I I I型(Pearson type-III)。因此,採用前人的研究方法[7][5],將包括無雨日在內的日降水資料視為隱藏高斯變數(Latent Gaussian Variable; LGV),同時處理有雨日和無雨日,發展出適合臺灣本地降雨特性的參數化經驗模型。利用已開發的測站資料補遺方法[8]和空間內插技術[10],將位置分佈不均勻的測站資料,內插到1公里解析度的網格上,產製出高解析度的網格化日降水資料庫。產製資料的流程如圖2所示,詳細的網格化方法與步驟可參考翁和楊(2018)[2],文章中2.2節~2.4節的內容。
 
圖2:日降雨網格資料庫的產製流程。
 

網格化資料的不確定性分析

產製網格化資料過程中,為了評估發展出來的參數化統計模型好壞,以及各項步驟的不確定性,分析主要三項誤差來源:
a.最佳化的統計模型的不確定性(圖3),透過”leave-one-out”的交叉驗證實驗,比較最佳化統計模型參數反演出來的各測站降雨估計值與觀測值間的樣本均方根誤差(Root-Mean-Square-Error; RMSE)。
b. 測站補遺誤差的不確定性 (圖4)。為處理測站分布不均的問題,需先進行測站補遺,增加資料的豐度,此時測站密度越高誤差愈小。相較測站較密集的西部平原,在偏遠山區因測站密度較低使得誤差較大。
c. 測站分布不均的不確定性(圖5)。承襲前階段補遺資料,將測站網格化的過程中,會將資料補遺的誤差從測站較密的地方往測站較疏的地方擴大。
 
透過不確定性的分析結果顯示,測站資料豐富度與測站密度是影響不確定性的兩大主要因素,當測站密度愈大(小)時,誤差愈小(大),數值越小(大)。特別是做網格化的步驟時會將前階段資料補遺時造成的誤差進一步往測站豐富度低甚至為零的偏遠山區擴大。 
圖3:最佳化的統計模型的不確定:全域法反演之估計值與觀測值間的樣本均方根誤差(RMSE)。(單位:mm/day)
圖4: 測站補遺誤差的不確定性:測站資料補遺時,代理的參考測站可用觀測資料間的樣本標準差(standard deviation)平均值。(單位:mm/day)
圖5: 測站分布不均的不確定性:承襲前階段的補遺資料,測站資料網格化時,每個網格點,逐月的樣本均方根誤差(RMSE)。(單位:mm/day)

 

日降雨網格化資料庫的應用

下面將展示一些日降雨網格化資料庫的實際應用。圖6是氣候上臺灣地區各月份的降雨空間分佈,降雨特徵明顯反映盛行風和區域地形間的交互作用。冬季受東北季風影響,迎風面的東北海岸和宜蘭蘇澳,丘陵地有較大降雨強度。夏季時,臺灣南部山區受南中國海季風(South China Sea Monsoon; SCSM;cf. Wang et al., 2004)[9]爆發後西南氣流帶來的水氣影響,降雨顯著,但背風面的臺東、成功,雨量相對偏少,整體降雨型態隨季節呈現逆時鐘走向。
圖6:1960~2015年期間,月平均降雨氣候場。(單位:mm/day)
 
圖7是2016、2017年的梅姬和尼莎颱風,在臺灣地區的降雨空間分佈,降雨分佈的特徵,反映出颱風路徑對區域降雨的影響。梅姬颱風為穿心颱,9/27日颱風通過前,臺灣的東北部是迎風面,為主要降雨區;颱風通過後,臺灣西南部是迎風面,為主要降雨區,之後又引進西南氣流使得9/28日的西南部有不少的降雨。尼莎颱風從臺灣北部穿過,降雨分佈與梅姬颱風類似,7/29颱風通過,臺灣的東北部和西南部為迎風面,有較大的降雨,7/30日受西南氣
流影響,臺灣南部為主要的降雨區域。

 

圖7:為2016、2017年的梅姬、尼莎颱風期間,臺灣地區的降雨分佈。(單位:mm/day)
 
氣候變遷的應用上,可利用日降雨網格化資料庫,定義出不同雨季,圖8(a)冬雨季、(b)春雨季、(c)梅雨季、(d)颱風雨季的主要降雨區和主要雨區的顯著降水事件,詳細的降雨區與降水事件定義請參考翁和楊(2018) [2]文章中4.4節。進一步分析顯著降水事件的發生頻率和區域平均降雨強度的長期變化趨勢,分析發現各雨季顯著雨日降水強度的長期趨勢均變大(粗黑線),而且統計顯著性都至少90%信心度。除了梅雨季,各雨季的顯著雨日發生頻率也都增加(細灰線)。梅雨季的顯著雨日頻率的統計顯著性雖不足,只有82.5%,但近期似乎正呈現減少的趨勢。
 
圖8: 不同雨季在主要降雨區發生顯著降水事件的發生頻率(左邊標尺: 次/年)與雨區平均雨量強度(右邊標尺: mm/day),分年統計再經7年滑動平均處理後的結果分別以細灰實線和粗黑實線的折線圖表示。細灰、粗黑直線分別是頻率和強度的線性趨勢。
 
目前日降雨網格化資料庫的水平解析度有1公里和5公里兩種版本,有研究需求的讀者可透過申請後獲得(TCCIP資料申請網站:https://tccip.ncdr.nat.gov.tw/)。
 
延伸閱讀
 
何謂降水量和降水量觀測儀器的歷史?
交通部中央氣象局,氣象百科,氣象儀器第12、13問
https://www.cwb.gov.tw/V8/C/K/Encyclopedia/inst/index.html
用對資料、選對工具-談資料特性
https://tccip.ncdr.nat.gov.tw/km_newsletter_one.aspx?nid=20180928161943
 
參考文獻
  1. 周佳、劉紹臣,2012,「全球氣候變遷觀測」,大氣科學,第40期,185-213。
  2. 翁叔平、楊承道,2018,臺灣地區日降雨網格化資料庫(1960~2015)之建置與驗證,臺灣水利,第66卷(第4期),33-52。
  3. Abatzoglou JT, 2013, Development of gridded surface meteorological data for ecological applications and modeling., International Journal of Climatology, 33, 121-131.
  4. Déqué M, Rowell DP, Lüthi D, Giorgi F, Christensen JH, Rockel B, Jacob D, Kjellstrom E,de Castro M, van den Hurk B, 2007, An intercomparison of regional climate simulations for Europe: assessing uncertainties in model projections., Climate  Change, 81, 53-70.
  5. Durban M, Glasbey CA, 2001, Weather modeling using a multivariate latent Gaussian model., Agriculture and Forest Meteorology, 109, 187-201.
  6. Giorgi F, Jones C, Asrar GR, 2009, Addressing climate information needs at the regional level: the CORDEX framework., WMO Bulletin, 58, 175-183. (Available at http://cordex.org/images/pdf/cordex_giorgi_wmo.pdf.)
  7. Glasbey CA, Nevison IM, 1997, Rainfall modeling using a latent Gaussian variable., In T. G. Gregoire et al., Eds, Modelling longitudinal and spatially correlated data: Method, Applications, and FutureDirections, No. 122 in Lecture Notes in Statistics, 232-242. Springer, New York.
  8. Simolo C, Brunetti M, Maugeri M, Nanni T, 2010, Improving estimation of missing values in daily precipitation series by a probability density function-preserving approach., International Journal of Climatology, 30, 1564-1576.
  9. Wang B, LinHo, Zhang Y, Lu MM, 2004, Definition of South China Sea monsoon onset and commencement of the East Asia summer monsoon., Journal of Climate, 17, 699-710.
  10. Watson D, 1994, Nngridr: An implementation of natural neighbor interpolation., Dave Watson Publisher, Claremont, Australia, 170pp.
  11. Wood AW, Leung, LR, Sridhar V, Lettenmaier DP, 2004, Hydrologic implications of dynamical and statistical approaches to downscaling climate model outputs., Climatic Change, 62, 189-216.
常問問題
Q : 為何TCCIP對外僅提供5公里網格化資料,而不提供1公里網格化資料呢?

由於測站點的設立在空間分佈上的不均勻,特別是臺灣山區地勢陡峭且高度差異幅度大,使得觀測資料不易蒐集,因此1公里高解析度資料在山區不確定性較高。然多數使用者所需要的資訊為區域空間上,長期且穩定的溫度(降水)氣候分佈情況,故以5公里解析度的方式則較可以合理呈現不同變數的氣候變化情形。

為此,TCCIP於「資料政策」中依據資料的不確定性與測試完整程度將資料分為四個層級(LEVEL1-4),前述5公里網格化資料屬Level2開放資料,可直接於氣候變遷資料商店申請使用;而1公里網格化資料屬於Level3進階資料,對於有需要以高解析網格資訊做衝擊模擬評估的進階使用者,則可至進階資料需求進一步申請。

名詞小櫥窗
什麼是:「leave-one-out交叉驗證實驗」

交叉驗證(Cross-Validation)為統計學上,用來驗證「統計模型」好壞的方法。其中一種常見的方法為” leave-one-out”。以本研究為例,想要評估1月份的模型參數是否理想時,先令1960年1月全部測站的可用觀測(含無雨日)缺失,利用剩下年份同屬1月份的可用觀測資料建立最佳統計模型後,反演推估1960年1月的缺失值,依此類推到其它年的1月,再重覆執行到其它月份,得到一組統計模型參數推估的全部測站日雨量序列資料,即可評估其與實際觀測值間的誤差量。

TCCIP最新消息
【氣候專欄】發刊囉!
   發佈日期:2020-05-01

本文由TCCIP張珈瑋佐理研究員向國泰金控投資長程淑芬徵詢相關知識與建議,並由程淑芬投資長以及國泰金控吳思昀經理共同校稿完成,對於企業應跟上全球氣候相關財務揭露 TCFD有精闢之剖析與建議。詳見 量化氣候變遷風險:企業為何應跟上全球氣候相關財務揭露 TCFD 的腳步?

氣候變遷新聞
拿冠狀病毒大流行與氣候變遷來相比較是一項令人沮喪的工作。用一個危機來說明另一個危機的危險程度通常是不太容易的,因為人們一次只能對一件危及生命的威脅、一場改變世界的危機有感。此刻,當全世界在遏制COVID-19方面的集體失誤讓我們記憶猶新時,冠狀病毒與氣候危機至少還有一個值得一提的相似之處:數據上的些......
< 詳細閱讀 >
回上頁