數位時代孕育了資料密集的研究過程,促進資料的產生,以及便於儲存、管理、不受限時空的交換。在此背景下,同時為解決學術傳播與研究品質等議題,開放科學在近年來呼聲漸漲。Lyon(2016)將開放科學分為三個維度,包含人民參與(Participation)、研究成果公開(Open Access)及研究過程透明化(Transparency),而研究資料管理成為開放科學重要的實踐方式。
研究資料是在執行研究過程中產生,用於驗證、重建與分析研究結果的紀錄事實型資料,資料類型因領域差異而有所不同,所有資料都有可能在特定時間點成為研究資料。研究資料管理則是在資料生命週期中計畫、蒐集、組織、分析、儲存、典藏至分享上述資料的過程,涵蓋以資料推廣利用為主要目的資料庋用(Data Curation)概念,管理方式則因資料類型與性質而異。
資料是研究的核心,然而相較於其他學術產出,研究資料破碎且容易遺失或無法讀取,故須妥善描述、說明與儲存,才能後續長期典藏,並持續共享利用。
特別提醒若資料集內容未來需申請專利、涉及商業機密或受測者機敏資料等,則需進一步確認公開可行性,妥善去識別化、延後公開或避免公開。
資料的生命週期常是超越整個研究的執行過程,早於資料蒐集階段,同時包含結束後的資料再利用,而研究資料管理的過程亦然,有效的研究資料管理需在每一階段步步為營。
定義生命週期的各階段,可幫助研究者確認管理的步驟。各單位已依其學術社群或領域特性提出多元的生命週期模型,可供選擇參照,許多研究可能僅需經歷部分階段。
較知名的模型包含以下幾種,可點選標題連結,進一步了解各階段內容,或參考Checklist等文件快速掌握各階段任務:
由英國Digital Curation Centre提出,較適用於組織或聯盟的執行框架,著重資料描述、篩選、整備至典藏,並可供取得的過程。其將資料描述、保存計畫、學術社群活動與制度觀察,以及促進庋用與保存視為貫串週期的持續性工作。
☑ Checklist
由英國國家級社會科學典藏平台提出,包含計畫、蒐集、處理與分析、出版與共享、保存、再用,共六階段,其特色在於資料的出版共享早於儲存。
☑ Checklist
由美國地質調查局的資料整合部門提出,其支援單位內研究者產出的地形、自然資源與災害因應相關資料管理,故此模型提供各項流程的概覽幫助擬定計畫。其中包含六個主要階段:計畫、徵集、處理、分析、保存、公開/共享,其中資料詮釋、品質管理及備份等則是貫串整個週期。
☑ Checklist
由哈佛醫學院Longwood Medical Area的研究資料管理工作小組所提出之生醫領域研究資料生命週期,共包含六階段:計畫與設計、蒐集與創造、分析與合作、評估與典藏、共享與傳播、取得與再用。每階段均提出4項資料管理任務,並將「儲存與管理」置於核心,確保資料與受測者個資之安全。
研究資料管理範疇甚廣,為利研究者順利實踐,除完善學習資源外,歐美各國亦已開發整理豐富的輔助工具軟體,可依研究階段、資料類型,領域特性進行選擇,並發展如COPTR的彙整資源,以歸類工具供研究者查找。
本工具庫精選國內外學習資源與常見工具,並匯整前節各生命週期模型之重要元素,整理成五階段,並以「儲存與詮釋」貫串週期,作為分類架構,以概括相關學習資源與工具。您可點選下圖週期各階段名稱,進一步了解階段概念、學習資源與輔助工具,或向下概覽後,點選「More 」了解更多。
此為多數研究資料生命週期模型的起始階段,希望研究者在研究開始前,預先規劃資料管理的過程與所需資源,並撰寫研究資料管理計畫(Data Management Plan, 簡稱DMP)。DMP的內容及功能在於描述如何管理與描述、長期保存資料的正式聲明,通常須包含研究資料的類型、描述資料的標準、儲存與取用資料的方式、蒐集資料的研究倫理與授權議題、資料管理相關人員的角色與權責、管理所需的資源於成本、長期典藏方案,以及如何符合FAIR原則(Findable、Accessible、Interoperable、Re-usable)提供共享再用……More
原始資料蒐集為研究者熟悉的流程,透過一致的蒐集格式、有組織的檔案命名與儲存架構並詳加註記錄蒐集過程,能使執行方式標準化,並提升後續描述、分析及典藏之效率。此階段的管理任務包含維持格式結構一致、依循檔案儲存架構,以及彙整記錄蒐集過程……More
在資料生命週期的每個階段都包含了品質確認、記錄描述與儲存共享等作業的規劃或執行,如蒐集資料前的預防錯誤,分析與典藏時的再次確認,而各階段資料的變動亦都須妥善保存,並詳加記錄,以利管理與再用……More
原始資料需進一步處理、彙整以進行分析與視覺化,建議應完整保留原始資料檔案,另存分析所需且符合軟體需要的檔案格式來進行相關流程……More
研究資料的公開共享,是研究資料管理的主要目的之一,為提升研究過程透明度,回應研究再現性的訴求,對作者而言,同儕間能發掘並引用研究資料,作為一種研究成果,同時滿足出資單位或出版單位的規範。資料公開典藏時需考量如何選擇、整備處理、描述說明與授權條款等事項……More
公開共享的研究資料可做為其他研究者的二手資料,通常可用於補充、整合、測試或驗證,屬於開放資料的一種。另一類政府機構產出的開放政府資料,亦是研究者豐富的資料來源,可取得範圍較大、權威單位產出或難以取得之資料,並有許多跨平台的整合查詢工具,而各國、各領域、各單位亦都有其各自發展建置的典藏庫…More
研究資料服務係為提供資訊、諮詢或在整體生命週期間的軟硬體管理等服務協助,OCLC在2017年出版的 The Realities of Research Data Management系列中,透過英、美、荷、澳四間大學的案例分析,將相關服務歸納為教育(Education)、專業(Expertise)及庋用(Curation)三面向,內涵說明如下,可作為服務規劃的依循,OCLC並強調各單位的服務是否完整涵蓋三面向,並非必要且非服務品質的評斷標準,應依單位需求、資源等現況量身打造。
目前歐美紐澳等國較常見的研究資料服務包含DMP指引、建置資源入口網站、提供訓練、建置典藏平台,以及提供相關諮詢與工具,包含資料探索、儲存、合作、發表、典藏、著作權、授權、引用等,部份結合校內其他單位或成立專責組織提供分析服務。
國際更有許多推動研究資料服務的專案或組織成立,並提出服務設計的指引,包含英國數位庋用中心( Digital Curation Centre )的指南,提供服務規劃、評估、政策制定等相關建議文件,另有Research Data Alliance(RDA)依議題或領域成立任務小組,提供交流平台並發展各類指引。
此外,如前述OCLC系列透過案例分析歸納服務發展方法,另亦有下列文件,彙整更多案例做為規劃發展參考: