知識專欄 / 電子報 / TCCIP 電子報第036期
TCCIP最新消息 氣候變遷新聞 常問問題 名詞小櫥窗
2020/04/01 臺灣氣候變遷推估資訊與調適知識平台電子報036期 302 點閱人次
封面故事

淺談TCCIP研究資料管理計畫

林士堯 專案佐理研究員

 
   對於研究工作者來說,資料的蒐集和使用往往是工作上最困難的一塊,尤其在面對跨領域資料的解讀上,更是面臨重重的難關,雖然近幾年開放資料已成為一種國際趨勢讓取得資料變得容易許多,但是研究類型的資料其實並不包含在內,因為研究資料不單只是資料的蒐整,更多了整理分析轉譯成為資訊及知識的成分,且在多了著作權的考量後,共享研究資料就變的困難。
 
    近年來,在科技部自然司永續學門開始推動研究型計畫的資料管理計畫(Data Management Plan,簡稱DMP),其目的除了因應貝蒙論壇「資料與數位成果輸出管理計畫」(Data and Digital Outputs Management Plan,簡稱DDOMP)並與國際接軌外,同時也希望透過挑選一些計畫來作為示範案例,以建立國內開放研究型資料的政策制度,讓計畫所產製的資料能永續地留存與使用,TCCIP作為國內少數經營多年的大型計劃,既涵蓋多領域人才,又有五年以上的資料服務經驗,理所當然地肩負起擔任示範案例的重責大任。
 
   一旦談到「資料管理計畫」,對於不同立場的角色如:政府單位、研究學者或是產業開發商的角色來說,看待「資料管理計畫」的角度都不盡相同,在國際間近幾年發展出相當多關於資料管理的論述與教學資源,能透過提供不同研究計畫以線上問卷的形式逐步拼湊出適合該項計畫的管理架構,亦提供各式不同計畫的架構範例做為參考,例如數位保存中心(Digital Curation Centre,DCC)的DMP Online以及DMP Tool…等網站。而「資料管理計畫」所需管理的資料種類、格式相當繁多,以貝蒙論壇為例,其所要求的「資料與數位成果輸出管理計畫」所涵蓋的對象不只是資料,還包含文字記錄、影像紀錄、軟體、問卷等數位資訊都被納入可管理的資料類別。
 
   整體而言,綜整資料管理方法,首先要釐清幾個問題,包含:
1. 希望達到的目標為何?
2. 管理的對象(資料)包含哪些?
3. 如何滿足「FAIR原則」?
4. 如何落實管理?
5. 確保資料品質的策略?
6. 資料存放及提供的機制?
7. 由誰來負責執行及維護?
8. 需要那些詮釋資料?
9. 如何檢討及修正管理計畫?
 
 
此外,Wilkinson等人在2016年發表了一篇關於資料管理的文章,內容闡述管理的「FAIR原則」:也就是Findable(可尋找)、Accessible(可取得)、Interoperable(互操作性)以及Re-usable(可重複使用)等四大核心原則。符合此四大核心原則的資料必須滿足:「可尋找」是指能被人或電腦輕易地搜尋到,並且可被電腦使用;「可取得」是指可在資料被搜尋到的同時,透過身分驗證或授權等方式來取得資料;「互操作性」是指可和其他不同的資料結合,並透過應用程式或工作流程來進行分析、處理和儲存;而最後一項「可重複使用」目標則是指透過完整描述的詮釋資料使資料能一再被重複使用。如今、這四項原則在資料科學領域內以是被公認且遵循的指標,也是TCCIP計畫預期達成的目標。
 
為此,TCCIP計畫團隊首先從幾項對外提供服務的資料上開始著手,針對每筆資料進行盤點,包括:產製者、產製方法、產製時間、資料版本、資料來源、發表文章等逐一清點,遂能撰寫成資料生產履歷。除了從產製者的角度由上而下的考量外,也需要由下而上的從使用者角度制定容易被理解及使用的資料格式,包含時間尺度及長度、空間範圍、涵蓋變數、單位、解析度、檔案的命名規則以及存放的空間等(如圖一)各項資料標籤,並將這些元素編撰寫成資料說明文件。
 
圖一、TCCIP研究資料標籤
建立每筆資料的標籤讓使用者更了解資料特性。
 
   
    TCCIP計畫落實管理計畫的方式包括:一、制定階級的管理機制,分別安排小管理者負責不同的研究資料,並向主要管理者反映管理成效。二、利用資料的生命週期(如下圖二),從「規劃」-「產製」-「檢核」-「儲存」-「發布」每個階段間逐步推進,最終再回到新資料的「規劃」,並使每個步驟都能符合管理計畫內容的規範。三、透過教育訓練凝聚並達成團隊內成員的管理共識,才能夠有效的落實管理計畫,四、透過使用者的意見回饋調整管理流程,提高使用者的認同與支持意願。
 
圖二、資料生命週期
資料的應用透過生命週期的循環後衍生出新的資料需求,再次進入循環週期。
 
    TCCIP計畫團隊所建立的「臺灣氣候變遷推估資訊與調適知識平台」網站更進一步符合「FAIR原則」,建構起一個不論是計畫內、計畫外、跨團隊與跨機構的使用者都能夠共享資料的管道。該平台提供多項研究資料的下載應用,同時提供API服務,讓跨平台的機器也能夠直接使用TCCIP所產出的資料;TCCIP計畫亦建立會員機制,在提供資料的同時也能妥善管理使用者資料,追蹤相關研究成果、收集使用者回饋、並提供版本更新等資訊,進而達到資料再使用之目的。
 
目前TCCIP計畫團隊已完成管理計畫的擬定,逐步將管理流程融入到整個團隊的運作當中,期待對於資料管理的重視,讓TCCIP資料管理能夠永續經營,使用者對平台所提供的資料服務與資料品質能更有信心!
 
延伸閱讀
 
TCCIP最新消息
立委洪申翰委員視察瞭解氣候變遷相關工作進展

立法院新科立委洪申翰委員非常重視氣候變遷議題,於2/18親率辦公室同仁來國家災害防救科技中心視察,了解目前科技部推動氣候變遷相關工作的進展。(詳情)

國泰金控程淑芬投資長蒞臨演講

TCCIP計畫邀請到國泰金控程淑芬投資長於2020年2月4日蒞臨演講,以"責任投資 – 金融業的永續影響力"為主題,為我們分享企業永續及責任投資國際發展趨勢,並以國泰金控為例,放眼國際來說明責任投資與放貸相關作為,同時說明氣候變遷對企業營運管理、業務發展及投資的重要性。(詳情)

氣候變遷新聞
叢林大火在澳洲是無法避免的一個天災,通常由雷擊等自然因素所引發。不過這次大火的規模與強度都前所未有,至目前為止至少有17人在大火中喪生、1,200多個房屋被破壞、550萬公頃的土地被燒毀。這些致命火災的罪魁禍首便是氣候變遷與溫室氣體的排放上升。澳洲過去的三個月在熱浪的夾擊之下,氣溫創下歷史新高(全國......
< 詳細閱讀 >
常問問題
Q : 計畫團隊內如何透過資料管理(Data Management)優化資料品質,提高使用者對資料信任度?

一、計畫團隊對於產製出來的資料會從各種不同的面向進行分析確認問題,例如統計降尺度資料會有基期和推估的氣候表現分析。二、透過團隊內非氣象領域(如淹水、坡地災害、海岸災害、農漁業、水資源及公共衛生等)研究人員做應用分析來改善資料。三、透過國內外期刊或研討會的方式進行學術發表。四、除了資料說明文件和生產履歷外,也提供計畫各年度研究成果報告給使用者參考。五、提供的資料若有改版或更新,依照管理流程會於平台公告並主動通知曾經下載的使用者。

名詞小櫥窗
UNDEF(無意義值)

在使用資料時會遇到一些不合理的數值,可能是極大或是極小或不合常理的數值,或是以文字、NaN等值出現在資料內,這些是因儲存格式的需求而被填補上去的無意義數值,不能被列入計算的資料,例如以歷史觀測網格資料來說:資料來源是陸地上的測站,因此海上就不會有資料,以二維平面的空間分布儲存時就需要把海上的位置填補數值,此時就會需要用到無意義值。

回上頁