科研信息化簡介


科研信息化簡介


科研信息化的產生

人類社會的不斷進步對科學研究提出了越來越高的要求。今天,科學研究的前沿正在從微觀和宏觀兩個方向上向著未知的領域大踏步地前進,已經前進到一個更加複雜深奧的世界,對科研方法和手段也提出了新的挑戰。科學研究的對象也大大超越了簡單的孤立系統,而向著大範圍、多領域的複雜系統工程進軍。例如,航天工程、全球氣候、生態環境問題等等。顯然,現代科學研究的對象已經變得越來越複雜,這無疑是一個挑戰。

傳統的科研方式由於其具有較大的封閉性,導致不同地區的科研機構和人員間交流不足,導致重複勞動,這造成了科研資源的巨大浪費。而今,科研的方法和環境在不斷變化。在這個信息爆炸的時代,科研活動之間的交流、科研信息的獲取和處理,都在發生著許多新的情況和新的問題。因此,最大限度地滿足科研機構和人員之間交流與協作的需要,有效共享浩如煙海的信息,是現代信息通信技術給傳統科研帶來的巨大變革。

從國際上來看,國外對科研信息化的普遍叫法是e-Science,提出這一概念的英國科技部主任John Taylor給出了這樣的定義:“e-Science是指在重要的科學領域中的全球性合作,以及使這種合作成為可能的下一代基礎設施。”其中一個核心的要素就是資源共享,跨地合作,這也被認為是發達國家科研信息化之所以成效顯著的關鍵所在。

從我國傳統科研活動的進行情況來看,科研手段受到很多侷限,特別是缺乏模擬、仿真的能力。因此,傳統的科研活動中常常存在週期長、成本高的現象,甚至許多實驗是根本不可能做的,這些都曾造成“無米之炊”的困境。而計算技術的出現及飛速發展則大大改變了這一切,使得全球性的、跨學科的、大規模科研合作,跨越時間、空間、物理障礙的資源共享與協同工作成為可能,這將改變科學家從事科研活動的方法和模式,極大地促進交流合作,推動科學研究的發展。科研信息化已經成為整個社會信息化的前衛,是下一代互聯網絡技術及信息基礎設施在科研領域的率先應用。

科研信息化的內涵

e-Science的實質就是“科學研究的信息化”,是信息時代中科學研究環境和科學研究活動的典型體現。它不僅包括採用最新的信息技術,如Grid等,建設起來的新一代的信息基礎設施,更有在這種基礎設施和相關支撐技術構成的平臺上開發的科學研究的應用,以及科學家們在這樣一個前所未有的環境中進行的科學研究活動。e-Science的實現將為科學家們提供一個信息化的科學研究環境,改變他們從事科學研究活動的方法和手段,甚至直接影響到一些學科的發展。

科研信息化的意義

既然e-Science的實質可以看作就是科學研究的信息化,那麼這與整個社會的信息化也是密切相關的。從國民經濟信息化到企業信息化,到城市信息化,到政府信息化,等等,信息化的重要性及意義已經被討論了很多,也得到廣泛的認識。而科研信息化在整個社會的信息化進程中其實扮演了特殊的重要角色。從Internet的發展歷史中可以看出,新技術最先在科研領域得到應用,然後是逐步地商業化,並擴展到全社會。當前,在下一代互聯網技術以及其他未來信息技術的研究中,e-Science正代表了這樣一種方向,e-Science正是下一代信息基礎設施在科研領域的率先應用。所以說,科學研究的信息化是超前於整個社會的信息化,做好e-Science的工作,一方面能夠大大提升科學研究的方法、手段和水平,另一方面也為整個社會的信息化探索道路。總之,在整個信息化浪潮的大背景下,e-Science科學研究的信息化具有特殊的重要意義[1]。 e-Science給科學研究活動所帶來的變化是前所未有的、革命性的,其可能產生的深遠影響也是絕對不容忽視的。最重要的一點就是e-Science使得一種嶄新的從事科研活動的方法和模式成為可能,這包括全球性的、跨學科的、大規模科研合作,跨越時間、空間、物理障礙的資源共享與協同工作,等等。可以預見,如果e-Science能夠實現,那麼對於科研信息在整個科學界的充分共享,縮小科學研究領域的數字鴻溝,加速發展中國家的科技進步,以及人類科學研究的更快發展,將具有劃時代的意義。而且,也可以看出,e-Science對於發展中國家的跨越式發展具有特別的意義。

科研信息化發展態勢綜述

隨著現代科學從微觀和宏觀兩個層面向縱深發展,變得空前複雜化,通信和計算機技術已成為目前科學研究活動的必備手段,同時科研信息和科研設備的共享,以及全世界科研人員間跨領域跨地域的合作也變得前所未有的重要,在此形勢下科研信息化應運而生。

科研信息化最早得名於英國的e-Science計劃,是指建立在新一代網絡技術和網格基礎上的全新科學研究模式。中國科學院副院長江綿恆指出,科研信息化的實質就是“科學研究的信息化”,包括兩個基本方面:一是信息化的基礎設施,比如英國、歐盟的e-infrastructure和美國的cyberinfrastructure建設;另一是信息化的科研活動。所謂科研信息化就是在信息化基礎設施支持下的科研活動。目前,許多國家都部署了國家層面推進科研信息化的計劃。

2001年英國政府投入1.2億英鎊啟動e-Science計劃,由英國科技辦公室負責統一管理,英國研究理事會總會負責協調,整體上分為e-Science核心計劃與各個研究理事會的e-Science計劃兩大部分。目前英國的e-Science計劃已經進入第三階段的發展,重點是科研信息化基礎設施(e-infrastructure)建設。美國自2002年以後,逐步形成了對建設信息化基礎設施(Cyberinfrastructure)的認識。美國Cyberinfrastructure建設的運行管理由NSF下屬的網絡基礎設施辦公室全權負責,其已資助開展多個基礎學科項目和技術項目,其中2001年啟動的TeraGrid已成為世界上最大、最全面、用於開放科學研究的分佈式網絡基礎設施。歐盟的科研信息化建設大體可分為三個階段,分別以歐洲數據網格(EDG)、科研信息化網格(EGEE)和歐洲網格計劃(EGI)三個網格項目為代表。EGEE現已成為世界最大的多科學網格,歐盟今後將支持歐洲e-Science網格向新的互操作、可持續模式轉型,開展歐洲網格計劃(EGI),建立泛歐網格基礎設施。其他國家和地區也相當重視科研信息化的發展,澳大利亞最近啟動了超級科學行動計劃,日本繼續推進NAREGI國家網格項目的建設,韓國啟動了國家e-Science計劃,德國、荷蘭、意大利、法國也紛紛啟動網格基礎設施建設,北歐、東南歐、波羅的海地區陸續啟動網格計劃,並逐步實現與EGEE的融合,此外,在EGEE的支持下,面向歐洲和拉丁美洲的e-Science網格設施EELA也得到長足發展。

根據當前世界各國科研信息化的發展狀況,信息化基礎設施建設的熱點和趨勢集中於五大緊密聯繫的領域。

(1)寬帶網絡尤其是科研教育專用網絡的建設,是一切基於網絡的科研信息化活動的基礎,當前世界各國都在競相展開高端科研教育網絡建設。目前,全球大規模學術網基本可分為三大主體:歐盟的GÉANT、北美的Internet2和亞太地區的APAN。此外還有其他一些跨國跨洲的大型科研網絡,如連接中美俄的GLORIAD、連接歐洲和拉丁美洲的ALICE、連接中國和歐洲的ORIENT等。

GÉANT計劃之前主要注重創建高容量的網絡,已於2009年初完成。從2009年4月開始GÉANT計劃進入第3階段GÉANT3,將延續4年。GÉANT3計劃更強調開發與提供工具和服務,為科研教育團體提供最佳性能的GÉANT網絡和世界一流的可靠服務。GÉANT3計劃意欲將用戶群拓展到新的學科、項目和機構,聯繫起生命科學、空間計劃(ESA)、對地觀測、氣候研究、氣象學、聚變研究(ITER)、高性能數字計算(PRACE)和其他新興項目,在更廣泛學科領域內成為歐洲信息化基礎設施(e-Infrastructure)的可靠服務組成。GÉANT未來面臨的挑戰是要能支持exascale(即每秒進行1018次運算)運算,改善網絡使用的便利性以增進全球合作,整合最新技術以支持未來互聯網設計。

從上世紀90年代中葉起,美國就陸續提出下一代網絡建設的三大計劃:美國政府的下一代互聯網(Next-Generation Internet,NGI)計劃、美國國家科學基金會(NSF)的超高帶寬網絡服務(Very High Speed Backbone Network Service,VBNS)計劃和Internet2計劃。其中VBNS和Internet2與科研信息化緊密相關。Internet2主要目標是:建設高性能的邊緣網絡,為科研提供基礎設施;開發具有革命性的互聯網的應用技術;促進新網絡服務及應用在互聯網上推廣。Internet2主要致力於各種類型的合作。Internet2連接著超過200家大學與研究機構,主要網絡基礎設施建設項目包括Abilene、GigaPoPs和FiberCo等。Internet2進行了核心中間件的開發,如shibboleth項目;參與某些中間件整合計劃,如MedMid(MedicalMiddleware,醫學中間件)和VidMid(視頻中間件)等。Internet2的最新進展是通過光纖將網內傳輸速率提高到100Gb/s。

亞太地區先進網絡APAN的各主要組成網絡如澳大利亞的AARNet、日本的SINET3、中國的CERNET在傳輸速度、覆蓋範圍等各方面均取得了長足的進步。

(2)科學數據中心建設和數據存儲、分析、管理等服務的提供能力迅速發展,已經從支撐科技活動的基礎資源演變為支撐國家科技創新發展的重要資產和戰略資源。如近年國際啟動了一大批有代表性的數據中心建設計劃,如美國的DateNET計劃、英國數字典藏中心DCC、澳大利亞的科研信息共享計劃(ARDC)、英國合格晶體結構數據中心建設項目(CCDC)等,在自動化技術、存儲管理技術、高可用性/災難恢復、虛擬化等方面取得了進展。

(3)超級計算與高性能計算服務獲得高度重視。高性能計算的能力不斷提高,以美國NSF資助的Track 1和Track2、美國能源部的ASC計劃、美國國防部的“先進高性能計算計劃”(UHPC)、歐盟的DEISA等計劃的推進極大地推動了超級計算的發展。該方向的發展態勢顯示利用多核/眾核CPU組建大規模集群系統、並行計算不可獲缺、GPU與CPU的競爭加劇、綠色IT與能耗問題漸受重視、雲計算方興未艾。

(4)虛擬科研組織和虛擬科研環境建設不斷加強。美國NSF推動的社會技術系統虛擬組織計劃(VOSS)、英國的虛擬科研環境計劃(VRE)、GOLD計劃、歐盟D4Science和D4Science-II項目等使虛擬科研環境的建設不斷邁上新臺階。

(5)網格建設及相關技術迅速發展。網格標準漸趨統一,Web服務與網格相融合,網格計算與雲計算競相發展。

此外,在信息化基礎設施的基礎上,世界各國紛紛在信息化條件支撐下廣泛展開科研活動,覆蓋粒子物理、天文學、生物學、地球科學、大氣科學和生態學等多個學科領域。典型的應用項目包括大型強子對撞機(LHC)及其計算網格(LCG)、平方公里陣列(SKA)射電望遠鏡計劃、歐盟的氣候項目Metafor和Climate-G等。隨著科研信息化的飛速發展,今後必將有越來越多的工作能夠藉助信息化設施開展多層次、多學科、大範圍、跨地區的研究,取得重大的突破性進展。


分享到:


相關文章: