中科院發佈地球大數據共享服務平臺 5PB數據現可共享

中科院发布地球大数据共享服务平台 5PB数据现可共享

圖為數據共享服務系統的界面

中國科學院今日召開新聞發佈會,對外發布其A類戰略性先導科技專項“地球大數據科學工程”2018年度的重大成果——地球大數據共享服務平臺。

記者從會上了解到,地球大數據共享服務平臺是集成多領域海量數據,服務數據驅動的科學發現與決策支持的科學平臺。平臺以共享方式為全球用戶提供系統、多元、動態、連續並具有全球唯一標識規範化的地球大數據,通過建立數據、計算與服務為一體的數據共享系統,推動形成地球科學數據共享新模式。

據地球大數據專項負責人郭華東院士介紹,目前,平臺上的共享數據總量約5PB,其中對地觀測數據1.8PB,生物生態數據2.6PB,大氣海洋數據0.4PB,基礎地理數據及地面觀測數據0.2PB;地層學與古生物數據庫 49萬條數據記錄、中國生物物種名錄 360萬條、微生物資源數據庫42萬條、組學數據目前在線10億條。

記者從會上獲悉,此次重點發布的是地球大數據共享服務平臺的兩個核心系統和一個區域系統,核心系統包括數據共享服務系統和CASEarth Databank系統,區域系統則為數字絲路地球大數據系統。

據郭華東院士介紹,數據共享服務系統是地球大數據專項數據資源發佈及共享服務的門戶窗口,是地球大數據共享服務平臺核心系統之一,目前能提供5PB數據的共享服務。

在發佈會現場,來自中科院空天信息研究院的何國金研究員為與會人員演示了這一系統的操作。記者得知,該系統基於專項數據特點,可提供項目分類、關鍵詞檢索、標籤雲過濾、數據關聯推薦等多種數據發現模式,同時提供在線下載、應用程序編程接口訪問等多種數據獲取模式,支持可定製的多格式數據在線查看、預覽和查詢,並能夠應對各種個性化需求,進行統計、收藏、推薦、下載和評價服務。

據何國金介紹,數據共享服務系統採用全球唯一標識,隨時隨地精準定位與解析,是國內首次遵照國家標準《信息技術科學數據引用》(GB/T 35294-2017)在國家重大項目數據共享平臺發佈數據引用,為數據有序化關聯及全生命週期管理提供保障。“地球大數據專項匯交併對外發布的全部元數據,用戶可以利用這個系統,根據數據共享權限進行共享服務。”何國金說。

作為平臺的另一核心系統,CASEarth Databank系統則提供長時序的多源對地觀測數據即得即用產品集,包括1986年中國遙感衛星地面站建設以來20萬景(每景12種產品,共計240萬個產品)的長時序陸地衛星數據產品,基於高分衛星1/2、資源3號衛星等國產高分辨率遙感衛星數據製作的2米分辨率動態全國一張圖,利用高分衛星、陸地衛星等國內外衛星數據製作的30米分辨率動態全球一張圖,以及重點區域的亞米級即得即用產品集等。

據郭華東院士介紹,該系統制定全球遙感數據產格網規範,自主研發了高效的對地觀測數據引擎Databox,引入人工智能等先進技術,面向一般用戶、行業用戶和科學家用戶,提供不同層次的對地觀測數據分析與信息挖掘服務。“未來,用戶不僅可以利用其數據、計算和技術來實現應用,也可以上載多源數據,嵌入算法模型,並結合系統資源來完成特定的專題信息挖掘、知識發現和融合決策。”郭華東說。

與兩個核心系統不同,數字絲路地球大數據系統作為平臺上的一個區域系統,包括“一帶一路”區域資源、環境、氣候、災害、遺產等專題數據集94套、自主知識產權數據產品57類、共享數據超過120萬億字節。

據郭華東院士介紹,目前,該系統已具備千萬億字節級的軟硬件環境,在國際上率先研發了通用大數據平臺下地球大數據提取、轉換與加載工具集,實現了6大類數據的檢索、共享、產品可視化展現,並通過中、英、法等多語言版本在國際相關單位實施共享。

平臺上線意義何在?對此,中科院副院長張亞平在會上表示,科學數據的積累、開放、共享,已經成為世界科技發展的重要資源和推動力,中國科學院設立“地球大數據科學工程”A類戰略性先導專項,致力於推動地球大數據實現從被動共享到主動共享的轉變,從項目資源驅動到平臺與服務驅動的轉變,力爭在科學數據共享及其體制機制若干關鍵問題上取得實質性突破,為形成良好的數據共享新生態、新局面貢獻智慧力量。

對於平臺今後的發展,郭華東院士表示,目前,隨著硬件條件不斷完善,平臺數據將陸續上線,並且每年將以3PB的數據量進行更新。


分享到:


相關文章: