研究資料典藏庫(Research Data Repository;RDR),是一種永續性資訊基礎建設,用於長期保存與取用研究資料,以達再用(Re-use)之目的。因此,典藏庫除須具備保存(Preservation)功能外,更應有近用(Access),甚或庋用(Curation)功能,前者為利他人查得,而後者則涵蓋管理與推廣運用。
對研究者而言,典藏庫能夠幫助管理、組織並長期儲存與公開研究資料,以符合出資或出版單位的規範。而資料公開,更能藉由永久識別碼(如doi)被引用及追蹤使用情形,也藉此提高資料的曝光度及價值,進而可能提高相關著作的能見度及作者的聲譽。
近年來,此類典藏庫眾多,依服務對象可分為,國家、機構、計畫、贊助單位四類,另依典藏資料領域可分為特定領域型(Disciplinary)和跨領域型(Multidisciplinary;General purpose)。典藏庫特色、功能與目的多元,研究者可運用研究資料典藏庫名錄(Registry)篩選查詢。
影響典藏庫的選擇因素如下:
符合規定是選擇典藏庫的優先考量,各國研究出資單位及學術出版社多已針對其所贊助或出版的研究產出訂定資料管理相關規範,其中不乏強制研究者將其研究藉由典藏庫公開,各單位有其指定或推薦之平台,抑或對典藏庫功能及性質有其要求。
了解同領域的研究者是否有熟悉或常用的典藏庫,以提升資料對主要受眾之曝光度,如社會科學領域的ICPSR;;生醫領域通常依資料類型慣用多種典藏庫,如收錄基因序列的GenBank或收錄蛋白質資料的wwPDB;地球與環境科學的PANGAEA;人文領域的UK Data Archives等。
若研究者所屬機構提供相關典藏庫及服務,亦可納入考量,如由Harvard University推出的Dataverse系統運用於許多歐美學術機構,北卡羅來納大學的UNC Dataverse即是一例,而部份大學則於機構典藏架構下提供資料儲存與分享功能,如匹茲堡大學的D-Scholarship@Pitt,以及,臺灣大學的NTU Scholars平台。
常見的研究資料典藏庫多採限制儲存空間的免費服務,惟仍有部份典藏庫須付費,或由出版商、贊助廠商或機構出資,亦可能以會員制由個人支付,選擇典藏庫時仍應留意確認。
為全球性之研究資料典藏庫名錄,收錄約2800種典藏庫,可依主題、資料類型或國家瀏覽,亦可依資料庫功能篩選,或關鍵字檢索查找所需典藏庫,是目前選擇典藏庫的重要入門工具。
University of California Irvine圖書館依照學科主題,整理篩選各領域重要的研究資料典藏庫,包含:太空與天體物理、大氣科學與氣候學、生物與生命科學、化學、電腦科學、地球與行星科學、工程學、地球科學與地理空間資料、健康與醫學、人文學、海洋科學、物理學及社會科學。
為彙整詮釋資料標準、資料庫及資料政策之平台,其中包含資料庫名錄,整理近1800種典藏庫(Repository)及知識庫(Knowledgebase)供關鍵字查詢或依主題、資料類型、授權方式、國家、研究物種篩選。
NIH為美國國家衛生研究院,為帶動美國研究資料共享政策之先驅,其下的NCBI(美國國家生物技術資訊中心)維護了以下三種資料典藏庫清單,希望鼓勵並協助研究人員找到適合的資料分享平台:
1.Open NIH-supported domain-specific repositories
包含儲存特定領域或資料類型之典藏庫,其中資料可公開提供給上傳者和使用者取用。
2.Other NIH-supported domain-specific resources
包含典藏庫及知識庫,其中資料的上傳與取用受一定限制。
3. Generalist repositories
包含跨領域綜合型典藏庫,收錄各種類型、格式、內容或主題之資料。
上傳至下列典藏庫之研究資料,均可自動取得DOI,且均採CC創用授權公開,在近用控制上均能在同儕審查時提供不公開資料連結。功能比較請參考Harvard Medical School、MIT library提供之表格或Generalist Repository Comparison Chart,詳情請點選平台連結瞭解。
由Center of Open Science(COS)提供的免費開源計畫管理典藏庫,透過整合相關工具,除可資料共享外,支援研究人員在整個生命週期中的書目管理、資料管理、工作流程紀錄、共享協作、版本控制、資料公開、取用控制與發表等各項需求。
由麥克米倫出版社所轄的 Digital Science 營運,為免費資料典藏庫,其優勢在於提供免費的個人儲存空間,且支援豐富的檔案格式,另可呈現公開資料使用分析。除能達成近用控制與公開需求,並透過整合相關工具,協助整體研究流程。
由Harvard University建置並免費開放給全球研究者使用的研究資料典藏庫,研究者可在平台中創建個人的「Dataverse」,其中包含由資料、程式碼及詮釋資料組成的資料集,並能組織、管理、詳盡說明資料及近用權限控制。
由歐洲核子研究組織(CERN)建置,並受OpenAIRE贊助維護,接受所有領域主題及類型之研究資料,除能儲存公開資料外,提供近用控制等功能滿足研究各階段的資料分享需要,此外,更提供豐富的使用分析數據。
由多家出版社及學術機構合作推出,以經同儕審查期刊文章之研究資料為主要收錄標的,主題則以自然科學與醫學為主,該平台特色為強制以CC0公眾領域授權宣告公開分享研究資料,其優勢在於儲存與檔案格式、大小的自由度,然須由所屬機構、出版商或出資單位付費,取用控制等功能上以期刊投稿的資料分享需求為主。
由Elsevier出版社所提供的免費研究資料典藏庫,便於個人分享與協作,提供完整的近用控制功能,並滿足資料公開需要,其優勢在於資料探索,整合Zenodo、arXiv等其他典藏庫及Mendeley既有文章書目資料。
由中央研究院之研究計畫團隊維護之跨領域研究資料典藏庫,運用CKAN開源軟體建構,上傳資料後可自動取得永久連結,亦可選擇開放授權方式,滿足投稿等的研究資料公開需求,另在近用控制方面,可透過設立專案方式,供專案成員共享,便於團隊合作、版本控制及詮釋資料的協同修改。
由中央研究院人文社會科學研究中心調查研究專題中心營運,以收錄問卷調查資料為主,相較於前述典藏庫,僅可作為資料公開平台。可填寫資料捐贈或交付表單並上傳研究資料檔案,將由平台專責人員聯繫、處理後上架,其典藏資料內容多為科技部計畫資料與政府部會應業務規劃及施政決策需要所辦理的調查統計。