保護你最重要的研究數據,這四件事做起來

保護你最重要的研究數據,這四件事做起來


國務院發佈的《科學數據管理辦法》,要求科學工作者將研究數據儲存到國家數據庫,確保科學數據安全,就連歐盟也在考慮實施數據保護相關法規。數據安全的選擇是如何影響我們的研究生活的?巧合的是,我在寫這篇文章的時候,一個也在讀博的朋友打了電話給我,告訴我一個恐怖的故事,她的同事把五年間得到的研究數據存在硬盤中,但不小心把硬盤給搞丟了,現在完全找不到!

關於研究數據,這裡有個真實案例告訴你,出事了會怎麼樣:

保護你最重要的研究數據,這四件事做起來

很明顯的,學術殿堂也聚集了各種關於數據丟失還有數據管理不良的恐怖故事,讓這些受災戶幾乎要放棄讀博,或是看數據能救回到什麼程度,再調整原來的研究方向。如果你是物理學或是醫學研究生,實驗室可能就是你的數據庫,如果你是人文或社會科學領域的博士生,你可能會有個存滿音頻、視頻和轉譯稿的硬盤。

雖然每個研究員都會想要相信自己的數據是安全的,但這很有可能不是事實。我們在讀博期間,經常太過專注在打怪,爭取下一個基金,或是爭取評等分數,導致有時候忽略了研究過程的根本:數據。在一個研究項目上投入幾年的時間,需要持續升級資源,最終創造豐富的數據庫,得出各種可能的成果。這種時候,要能成功完成手邊的研究項目,管理研究數據是必不可少的一環,本文帶你瞭解研究數據管理的關鍵要素。

告訴你為什麼要好好保護數據

對於研究來說,數據是推斷意義的媒介,是研究質量和誠信的展現。因此,有效的數據管理應該是每一個研究員都要注意的事。大學紛紛開始設立數據管理系統,讓他們的學者可以儲存、取得和運用數據。

負責任地管理數據可能是破解科研目前最大的問題之一,也就是不可重複性的關鍵。有效管理註冊數據,用合適的形式儲存數據,都能讓數據使用更加多樣化。科研人員可以將從不同方式蒐集而來的數據用在不同地方。還有,這能將不同人所蒐集到的同一批數據的層次區隔出來。這個數據能否被取得,是確保科學能重複的關鍵要素。

接下來,有效的數據管理可以保護數據不丟失,對研究成果和出版物產生深遠影響。對我朋友的同事來說,要重做原本進行順利中的研究,得再花上好幾年的時間!

研究可取得性:未來的關鍵

取得方式是數據管理的重要面向,因為這代表著是否能在既有研究的基礎上發展,還有挖掘尚未開發的領域的可能性。施普林格自然先前所作的調研顯示:“超過 70% 的參與人員都認為,未來所有的研究論文、學術專著和研究數據都應該以開放獲取的形式供人取得,有 91% 參與的圖書館員認為‘開放獲取是學術科研出版的未來’。就這方面來說,科研界中的各個相關團體越來越強調,不只要有責任地儲存數據,還要讓數據容易地被取得。”

技術公司和善心投資者現在也有諸多針對研究員的應用和服務。像 Mendeley、Readcube 和 Endnote 這類的應用軟件能儲存和引用文字數據,文字數據是社會和人文領域研究的大宗,也可以補充自然科學和物理學中的閱讀和註釋。

很多時候,單位或實驗室可以取得的數據需要分享給也在做相同項目的人跟第三方。現在也有開放數據的聲浪,呼籲科研人員選擇將數據開放獲取,或是放在共享獲取平臺上。

識別碼和資料庫在今日被廣泛使用,更加有效地管理數據,使用這些的好處有:

  • 保護研究:識別碼和資料庫可以設定訪問點和訪問權限,既能讓人取得,又能避免讓不想的人看到。
  • 可以宣傳數據:識別碼和資料庫可以讓科研人員提供路徑,根據分類來宣傳自己既前沿又新穎的研究。
  • 方便提供訪問路徑:如同上一點所提,識別碼和數據庫可以讓數據集有一個固定的訪問路徑,更方便使用。

數據也可以根據新收到的要求重新佈置,現在有大量但質量不見得好的研究,宣傳自己的研究更顯重要。使用識別碼和資料庫不只能夠給自己的研究一個身份,還可以確保你的研究安全地儲存在一個地方。這些工具或平臺既能讓人看到瀏覽研究數據,還能進行各自的隱私設定。

管理珍貴的數據,你該這麼做

具體的數據管理計劃開始出現在資助文件、贊助記錄還有重要官方文件中,因為這是研究可靠度的指標,可重複的承諾。根據這個現況,這裡有一些在管理研究數據時你該做的事:

  1. 儘可能的將數據存到雲端,使用雲端服務提供商的個人賬戶,或是學校的數據管理系統,這都可以降低數據丟失的風險。
  2. 將數據整理成容易找到也容易使用的形式,這可以提高你 的數據被找到的機會,特別是數據是公開或是分享出去的狀態。標準化數據集成為許多資助合同的新寵兒,著眼於國際最佳實踐。一定要注意軟件應用的優勢,儲存、分類和格式化你的數據。
  3. 你可以選擇讓你管理的數據開放獲取,目前對數據保存和彙集有比較多的宣導和特別關注。
  4. 養成每天儲存新增數據的習慣,以有組織的方式進行管理,分類、格式化並存放在容易找到和取得的空間。

數據經常被稱為研究員的金礦,這不是隨便說說。研究數據是龐大投資的結果,這其中有金錢,有時間,還有資源的投入,因此安全存放數據,提高被取得性,是科研進步的關鍵。然而,數據管理對科研人員來說一直是個挑戰,不管在科研生涯的哪個階段都是。讓更多人意識到數據管理的重要性是接下來科研界要做的事。

你對數據該怎麼管理和取得有什麼想法?歡迎留言分享你的看法、觀點以及經驗。


分享到:


相關文章: