雨量測站觀測與網格資料大不同?TCCIP網格化降雨資料案例分析
作者:王俊寓 國家災害防救科技中心 專案佐理研究員
童裕翔 國家災害防救科技中心 助理研究員
建立網格化觀測資料的重要性
地面測站觀測資料記錄了當地各項氣象要素 (氣溫、降水、風…) 的實際觀測情況,是氣象研究經常使用的資料之一,而對於許多研究領域而言,氣候因子的影響亦十分重要,除了過去氣候變化的分析,也應用在災害衝擊與風險評估等。然而,早期因為交通不便、地形崎嶇與維護不易等因素限制,在缺乏人類活動的山區幾乎很少設置測站 (如中央山脈區域),因此無法建立完整的觀測網,難以蒐集到長期穩定的歷史氣候資料。即使現今遙測技術發達,過去歷史的觀測資料需求,對於氣候變遷相關的研究亦無法取代。為了彌補此資料缺口,科學上常以網格化技術克服無測站記錄之區域的問題;而最好的作法是製作高空間解析度的網格化資料,以呈現溫度和降雨等氣候要素在複雜地形上的空間分布。
網格化觀測資料的發展
TCCIP計畫蒐整不同單位的測站資料 (圖1),將每日觀測資料從原本分布不均的測站點位,內插到1公里解析度的網格,建置長期的網格化觀測降雨日資料[1],並且每一年持續更新 (請參閱資料生產履歷)。在建立統計模型、資料補遺及網格化的過程,由於測站資料異質性[註],可能有相鄰測站之間雨量差異很大的情形,或是因測站分布不均,受限於參考測站數量少或距離遙遠,導致在部分區域有較大的不確定性 (圖2);主要發生在雨量多、測站稀少的區域,如雨季 (5 - 10月) 的山區,特別是中央山脈區域 (請參閱電子報第037期)。由於網格化資料在山區不確定性較高,而5公里網格 (0.05°×0.05°) 資料已可以呈現區域之間較一致的長期且穩定的氣候變化趨勢,可滿足多數氣候變遷研究的需求因此,TCCIP氣候變遷資料商店 (https://tccip.ncdr.nat.gov.tw/ds_03.aspx) 過去僅開放5公里網格化觀測資料。隨著1公里網格化觀測資料申請件數日益增加,並且已累積一定的研究應用成果,為因應不同領域對於更高解析度資料的需求,TCCIP氣候變遷資料商店已於2021年9月開放1公里網格化觀測資料 (level2),提供給各領域的使用者進行相關研究 (詳見新資料上架消息與資料清單)。
註:
測站異質性:或稱為不均勻性 (inhomogeneity),可能造成的原因如:測站遷站、觀測儀器更換、觀測方法改變、測站環境變化、各單位的資料品質控制 (Quality Assurance and Control, QA/QC) 的機制不同等。
圖1、1960 - 2019年全臺不同單位的測站 (雨量站) 分布圖。TCCIP蒐集的測站資料來源包含氣象局 (局屬站與自動站)、民航局、環保署、水利署、林試所及農試所等,包含現存和已撤銷測站。
圖2、 TCCIP網格化觀測降雨量資料的網格化不確定性分析,圖中色階為均方根誤差 (單位:毫米/日)。
資料特性的差異說明
TCCIP氣候資料申請者分析結果顯示,網格化觀測資料為最多人申請下載的資料。由於使用者在沒有使用網格資料的經驗前,習慣上會直接以測站資料進行驗證;發現相較於測站的雨量觀測結果,網格化資料的降雨量有低估的情況,進而影響資料使用的信心度,對於資料品質有所疑慮。
多數使用者忽略了測站與網格化資料特性不同的事實;若將測站資料視為實際觀測值,網格化資料則代表由網格周圍的測站資料,經過複雜的數學統計方法與空間插值得到各網格的「估計值」。因此,即使是距離測站最近的網格估計雨量也會與觀測有一定程度的差異;而沒有測站的區域就會有更大的不確定性,同時也缺乏測站資料可以驗證。
實際案例分析
以實際案例分析進行後續的探討。曾經有使用者以桃園市大園站雨量資料,與TCCIP網格資料進行比較,並反映網格化資料有低估雨量的情形。雖然明知測站與網格尺度的資料本質不同,不適合直接進行比較,但或許藉由檢視該過程,更能幫助使用者釐清測站與網格化資料的差異。此外,在探討網格資料的差異時,同時也須考量解析度的影響;即使是同一個地點的降雨量,不同網格尺度的資料也會有不小的差異。
我們挑選出距離大園站最近的1公里和5公里網格資料,繪製出2000 - 2005年的年總雨量時間序列 (圖3)。比較逐年降雨量,雖然兩組網格資料皆有低估的情形,但是1公里資料與測站雨量沒有太大的差異 (約少10%~20%),至於5公里資料就有更明顯的低估 (約30%~50%),尤其是降雨量較多的年份,如2000年和2005年。
圖3、 2000 - 2005年大園氣象站的觀測年總雨量,以及對應的TCCIP網格化觀測降雨資料。圖中黑線為測站資料,紅線和藍線分別為1公里和5公里網格資料,皆取自距離測站最鄰近的網格。
由上述情形可知,直接比較測站及單一網格的結果顯然並不恰當,應該以測站及附近區域檢視降雨的空間分布。我們利用1公里和5公里網格資料,分析桃園市大園站及附近區域的逐年降雨量,以及加入鄰近的幾個測站一同檢視 (圖4)。由1公里資料呈現出精細的降雨分布,雖然某些年份在測站周圍的網格點相對於觀測有比較明顯的低估,但普遍能反映出測站附近為降雨分布集中或偏少的情形。而5公里資料由於是區域平均的結果,雖然與1公里資料有相似的分布,但解析度降低就無法表現出細微的空間變異。
圖4、 (a) 桃園市大園及附近地區的測站分布 (左圖) 以及挑選最鄰近的1公里網格 (中間) 和5公里網格 (右圖)。測站分別為桃園國際機場、大園、中壢、桃園和八德站。(b) 2000 - 2005年桃園地區年總雨量的空間分布。上排為1公里網格資料,下排為5公里網格資料,圖中數值代表各測站觀測值,括號內數值則為對應的網格估計值。
進一步分析日雨量的變化,挑選大園站這幾年之中單月降雨量最多的2001年9月來比較測站與1公里、5公里資料的逐日降雨量 (圖5)。基本上,1公里資料都接近於測站觀測的雨量,5公里資料的差異就比較大,特別是9/16和9/18這兩天。值得注意的是,有別於網格資料的年總雨量經常為低估,從日雨量的比較可以發現,在某些日期 (如:9/2、9/16、9/22) 的網格雨量是大於測站觀測 (特別是9/16最明顯)。
圖5、 2001年9月大園站及1公里、5公里網格的日雨量時間序列。
我們挑選具有代表性的9/16至9/18由納莉颱風造成的強降雨事件,觀察幾個測站與鄰近區域網格的降雨分布 (圖6),這3天的測站與網格資料剛好呈現出三個不同的結果,9/16多數測站都明顯小於網格估計值,9/17測站與附近網格的差異很小,9/18則是測站明顯大於相鄰網格。這樣的差異主要是由於TCCIP網格化降雨資料並不是將同一時間點、空間範圍內的測站資料,直接內插成網格資料,而是只要過去曾經存在過的測站,在統計建模與資料補遺的過程,即使在不同時間、空間下的測站都能提供可用的降水訊息,以彌補測站時空不均的缺陷,但也因此無法避免測站資料品質不均一性、資料的不連續性,以及不同測站之間統計特性不相似等問題。
另外,由於測站位置可能剛好位於兩個相鄰網格的邊界,而使用者選取的網格可能與相鄰網格的數值差異很大,尤其是5公里資料,如9/16大園站左、右相鄰網格的降雨量差異超過100毫米,若挑選左邊網格會較接近測站觀測值, 但取最近距離則會挑選到右邊的網格,與測站之間有更大的雨量差異,這也是不建議使用者只選取個別網格與測站觀測值進行比較的原因之一
圖6、2001年9月15 - 18日桃園地區的日雨量空間分布。
結語
由以上針對降雨量的測站「點」資料和網格「面」資料差異的分析,已知高解析度的網格化資料,能保留鄰近測站觀測到的降雨強度,因此在測站密度高且資料品質一致的區域,通常可以呈現出接近實際觀測的細緻降雨空間分布。但是當解析度降低時,在降雨空間分布差異又大的情況下,因為區域平均的關係,容易造成網格資料有較大的日雨量差異,因此長時間累積降雨量的差異也愈大;相反地,在測站密度低的區域 (如中央山脈區域),網格點距離參考測站遙遠,我們無法知道這些區域真實的降雨量與分布情形,基本上是空間內插出來的估計值,這也代表資料的不確定性更大。
TCCIP氣候變遷資料商店迄今已開放多組網格化觀測資料,包含溫度、降雨及 (衛星) 日射量資料,以及彌補觀測資料不足的歷史氣候重建資料 (如:風、濕度),使用者可針對自身研究需求進行資料申請與應用。同時,建議使用前應參閱資料生產履歷,確實瞭解各組資料來源、本質差異以及資料的不確定性;需要考量不確定性造成的誤差,對於後續研究與應用造成的影響,並斟酌是否需進一步對網格資料進行偏差校正。倘若使用者研究的時間和空間範圍內有測站資料,而該測站具有代表性,又或者有其他來源的觀測資料 (例如雷達資料),則建議優先使用。
參考文獻
[1] 翁叔平、楊承道,2018,臺灣地區日降雨網格化資料庫 (1960~2015) 之建置與驗證,台灣水利,第66卷 (第4期),33-52。
延伸閱讀
- 臺灣日降雨網格化觀測資料之建置與驗證
https://tccip.ncdr.nat.gov.tw/km_newsletter_one.aspx?nid=20200515170742
- 網格化觀測資料與統計降尺度不確定性分析說
https://tccip.ncdr.nat.gov.tw/publish_01_data_document_one.aspx?dd_id=20210609213136
喜歡這一期的文章嗎? 給作者一個讚!