【流式數據共享】在線存儲庫

1 簡介

科學研究比以往任何時候都更需要數據密集和協作。帶有批註的數據的透明性和公共可用性對於獨立驗證,確認以及從以前的結果擴展研究至關重要。因此,國家政策,國際監管機構,科學期刊以及研究資助機構越來越要求提供原始數據。

在基於熒光和質譜的流式細胞術中,原始數據通常由FCS文件表示,其中包含儀器分析的所有顆粒(細胞)的所有測量“通道”(特徵)表達值的矩陣(表) 。這些文件應根據適用的特定領域的準則進行正確註釋。在流式細胞術中,此類指導原則由有關流式細胞術實驗的最低信息表示。此外,應檢查biosharing.org網站(MIBBI項目)是否有適用的其他要求。

2 公共存倉庫

建議將數據存儲在公共存儲庫中以共享。下面介紹了四個適用於流式數據的公共存儲庫:Cytobank(http://www.cytobank.org/)、FlowRepository(https://flowrepository.org/)、ImmPort( https://immport.niaid.nih.gov)和ImmuneSpace(https://www.immunespace.org/)。表16提供了具有技術註釋和突出顯示的功能的概述。

表16. 流式數據存儲庫概覽

【流式數據共享】在線存儲庫


2.1 Cytobank

是由Cytobank Incorporated開發和託管的在線數據分析和管理平臺。Cytobank的社區版本提供免費功能,包括Web訪問,數據存儲,實驗共享和基本的在線分析。Cytobank的社區版本包含來自大約60個不同作者的近400個公共實驗(數據集)。此外,Cytobank還提供帶高級數據分析選項(包括SPADE和viSNE),更好的客戶支持和專用計算資源的付費高級版和企業版。如果您的實驗室已經在使用Cytobank,則選擇其社區版本將提供一個公開共享數據的簡單選擇。所有版本的Cytobank也可以實現只與合作者私下共享數據。

2.2 FlowRepository

是一個公共存儲庫,允許研究人員存儲、註釋、分析、共享和發佈流式數據,主要是與經過同行評審的手稿有關的數據。該儲存庫由國際細胞計量學學會(ISAC)免費提供。雖然FlowRepository是通過擴展Cytobank的代碼庫而開發的,但在過去的5年中,這兩個平臺通過添加不同的功能而差異化。但是,仍有許多共同的方面允許一個系統的用戶輕鬆地適應另一個系統。Cytobank的平臺提供了更高級的數據分析選項,而FlowRepository專注於數據共享和註釋,包括對MIFlowCyt的全面支持。此外,FlowRepository與幾種科學期刊緊密合作,並允許將數據與相關出版物鏈接起來。湯森路透(Thomson Reuters)和FlowRepository的數據引文索引(Data Citation Index)界面的合作可幫助研究人員獲得適當的信用數據。與大多數其他存儲庫不同,用戶無需註冊即可從FlowRepository下載公共數據。他們可以使用基於Web的界面匿名進行操作,也可以使用FlowRepositoryR BioConductor庫從R統計語言內部進行操作,也可以使用FlowRepositoryServer插件從FlowJo內部進行操作。目前,FlowRepository包含來自1,200位科學家的1,000多個數據集,並鏈接到30種不同期刊上的論文。目前有一半的數據集是公開的,其餘的大多數數據與正在進行的研究有關,其中基礎數據將與研究結果的發佈一起發佈。Nature,Cytometry A部分和PLOS期刊建議將數據存儲到FlowRepository。

2.3 ImmPort

免疫學數據庫和分析門戶(ImmPort)系統提供了由研究人員生成的免疫學研究數據的檔案庫,這些研究人員主要來自美國國立衛生研究院(NIH),美國國家過敏和傳染病研究所(NIAID),過敏、免疫學和移植科(DAIT)。它是一個廣泛的數據倉庫,包含由數十種測定類型產生的實驗和臨床試驗數據的集成,包括63種流式細胞術和5種CyTOF數據集。此外,ImmPort系統還提供數據分析工具,並以近50種模板的形式包含用於臨床和基因組研究的隱性知識和“最佳實踐”,以用於數據沉積,管理和傳播。ImmPort是由Northrop Grumman信息技術健康解決方案團隊根據生物信息學集成支持合同(BISC)為NIH NIAID/DAIT開發的。如果您的研究經費來自該來源,並且您正在生成免疫學數據,則應將其保存在ImmPort中。如果要生成流式數據的同時還有來自不同類型化驗的數據,Immport對不同數據類型的支持可能是選擇它的另一個原因。為了在ImmPort上存放和訪問數據,需要DAIT的(免費)註冊和批准。

2.4 ImmuneSpace

是一個數據庫和分析引擎,通過為人類免疫項目聯合會(HIPC)定製LabKey服務器而構建。ImmuneSpace可用於查找和探索研究,整合和分析所有試驗中的數據,以及直接在R內部執行自定義分析。ImmmmuneSpace利用了ImmPort的基礎架構,在許多情況下,ImmuneSpace提供了新的界面和新的補充。目前,ImmuneSpace正用於訪問12個大型HIPC研究(741個參與者)的流式數據,和4個HIPC研究的CYTOF數據。典型的數據提交工作流程包括使用一組標準化數據模板將數據提交到ImmPort。如是HIPC參與者,數據應存放在ImmuneSpace;或者也可以將ImmuneSpace用作HIPC數據和分析工具的寶貴資源。

3 臨床數據

對於臨床來源的數據,需要注意的是在共享之前,需要進行去身份化操作,以刪除用於識別個人的標識符包括患者姓名、保險號、公共ID號、出生日期等,以滿足各國的隱私保護法規。FlowRepository提供了去身份化功能,快速入門指南請參考:http://flowrepository.org/quick_start_guide。

Reference:

Guidelines for the use of flow cytometry and cell sorting in immunological studies

以上內容若有不妥敬請指正。

向所有一線抗疫勇士致敬!

微信號 : FACSinformation


分享到:


相關文章: