肖小溪 李曉軒:“融合科學”新範式及其對開放數據的要求

肖小溪 李曉軒:“融合科學”新範式及其對開放數據的要求

本文刊載於《中國科學院院刊》2020年第1期

專題“融合科學與開放數據”

肖小溪1 甘 泉2 蔣 芳2 陳 捷1 李曉軒1,3*

1 中國科學院科技戰略諮詢研究院

2 中國科學院發展規劃局

3 中國科學院大學 公共政策與管理學院

“融合科學”是一種基於多學科融合來解決重大問題的科研新範式,被認為是人類解決重大經濟社會問題的新機遇。推動“融合科學”意味著科研生態的根本性變革,其中一個最基礎的方面是數據開放共享。

近現代以來,科學研究極大地推動了人類探索知識和解決問題的能力,成為推動人類現代化的發動機。然而,現有以學科分割為基本架構的科學研究仍然無法有效解決能源短缺、環境汙染、健康威脅等人類面臨的諸多重大問題。

為此,自二戰以來興起的各類學科交叉研究和使命導向的研究,在 21 世紀初期逐漸凝結並演變成一種基於多學科融合來解決重大問題的科研新範式——“融合科學”(convergence science,又譯為“會聚科學”),並得到以美國為典型代表的科技發達國家的積極倡議。

中國科技界近年來的改革探索也與國際上“融合科學”新範式的發展趨勢高度契合。例如:中國科學院立足於多學科綜合優勢,在“十三五”發展規劃中提出了 8 個重大創新領域的戰略部署以及從融合視角開展的試點評估;以及國家自然科學基金委員會推動的“新時代科學基金資助導向”改革等。

“融合科學”將帶來一場科研生態的根本性變革,需要從規劃、組織、評價、人事等多個方面推動,其中一個最基礎的方面是數據開放共享。

本文首先探討了“融合科學”作為一種新科研範式的基本特徵,提出“融合科學”對基礎數據的新要求,進而介紹了數據開放共享支撐“融合科學”的成功實踐,最後展望了以開放數據推進“融合科學”的未來圖景。

1 “融合科學”的基本特徵

與傳統科研範式相比,“融合科學”新範式的根本區別在於“融合”。2011 年美國麻省理工學院發佈的白皮書中首次明確提出,生命科學、物理學和工程學的“融合”代表著生命科學領域的第三次重大變革,但其深遠影響將突破生命科學的範疇,推動健康、能源、食品、氣候和水資源等諸多行業取得重大進步。該白皮書進一步抽離出“融合”的本質,認為“融合”是將原本被認為是分離和割裂的方法、技術、流程和設備整合成統一整體,以此推動新的科學和技術進步。

2014 年美國國家研究理事會進一步指出:“融合”是一種跨越學科邊界以解決問題的(研究)路徑。該路徑整合了生命與健康科學、物理學、數學、計算機科學、工程學及更多種類的不同學科,形成一個全面、綜合的研究框架,來解決那些存在於多個領域交界面上的科學和社會挑戰。

基於已有文獻中對“融合”的闡述,可將“融合科學”新範式定義為:以解決重大問題為導向和最終目標的一種科研新範式。該範式通過整合多個學科領域的知識、技能和工具,形成一個全面、綜合的問題解決框架,並形成一個多方權益主體共同參與的網絡,以推動科研成果轉化為創新和產品。

在形成問題解決框架的過程中,多種要素的耦合是其基本內涵:“融合科學”既貫穿創新價值鏈全譜帶,又以多種學科的交叉和延展為基礎,涉及官產學研用等多類權益主體,通過各類要素的耦合進一步催生出新的知識增長點乃至重要的融合性領域。本文從 3 個方面闡述“融合科學”新範式區別於傳統科研範式的特點。

1 以重大經濟社會問題的解決為根本目標

“融合科學”以解決人類生存及發展中面臨的重大問題為研究目標,而不是以一般意義上的科學進步為目標。這意味著“融合科學”更強調科研的組織和有序,比傳統學科發展更依賴於優勢佈局。從這一點來看,“融合科學”與二戰及冷戰時期以軍事使命(如核彈)或者太空使命(如登月)為目標的“使命導向的科研”(mission-oriented research)具有相似性。相比於後者,“融合科學”的目標導向主要是圍繞與普通民眾日常生活休慼相關的重大經濟社會問題,這些問題在冷戰結束後成為擺在各國政府科技議程上的重要目標。

2 覆蓋從基礎研究到問題解決的長鏈條

傳統科研範式中,科研活動往往以知識發現或技術發明為最終目標。然而,“融合科學”並不止於新知識的發現,以及新技術、新工藝和新設備的研發,而是在重大經濟社會問題的目標引導下,進一步沿著創新價值鏈向後延展,跨越基礎研究與實際問題解決之間的鴻溝,直到形成真正能夠產業化的樣機、原型或解決方案,為最終實現市場上的創新提供保障。

換言之,“融合科學”在解決重大問題的導向下,連接了知識發現、技術發明和市場產品,以創新地解決實際問題為重點,有助於在傳統學術界和產業界之間主動發揮重要的橋樑作用,以更有效地跨越技術發明與產品市場化之間的“死亡之谷”。

3 依賴於多種學科之間的深度交叉融合

“融合科學”在研究手段上依賴於多種學科的深度交叉和融合,但並不是簡單地把不同學科的研究人員聚集在一起,而是在重大問題凝練伊始就將不同知識背景的研究人員有意識地聚集在一起,共同尋找解決特定問題或挑戰的研究方案,並且將學科交叉融合貫穿於解決問題或挑戰的全過程。

在學科之間相互滲透的過程中,不同的知識、理論、方法、數據頻繁地相互交織和影響,直到形成新的研究框架和新的科學語言。可見,相比於已有的各類學科交叉研究(如多學科研究、跨學科研究、交叉學科等),“融合科學”的目標導向更凸顯。

2 “融合科學”對基礎數據的新要求

從“融合科學”的基本特徵和典型案例來看,“融合科學”的底層基礎數據已經與以往科研數據大為不同。要實現“融合科學”所依賴的學科交叉融合、創新價值鏈貫通融合、各權益相關方協同融合,需要基礎性數據實現全學科、全流程和全景式的開放共享,使研究人員可以跨界訪問、完整獲取解決重大問題所需的科學界、政府界、產業界及非營利機構的數據,以支撐重大問題的最終解決。

這方面與大數據時代國際上“開放獲取(open access)”“開放數據(open data)”“數據共享(data sharing)”“開放科學(open science)”等理念相呼應。在實踐上,國際數據組織(如國際科技數據委員會),以及部分國家和地區正在大力推動的開放科學數據中心(如歐洲雲計劃“Gaia-X”)等為實現融合科研的全學科、全流程和全景式的數據開放奠定了重要基礎。

1

“融合科學”要求改變以往科研數據分學科管理和使用的狀況,以實現所有學科之間的數據開放和共享為基本要求

新公共管理運動以來,對公共部門的問責推動了公共部門的數據公開化(數據共享)要求。科研領域是較早重視並探索數據共享的公共領域之一。由於實際科研工作的需要,科學家自發地開展了局部範圍(如實驗室、研究機構層面)的科研數據共享。此後,在更大範圍內(如國家層面、全世界範圍內)的科研數據共享要求,推動了“開放獲取(open access)”的興起。

但是,現有的科研數據開放獲取主要是基於學科或者基於機構來操作,科研數據的開放更多地集中在單一學科內部、某一機構或出版商內部,數據的開放形式也多侷限於論文,只有少數機構或個人擁有查閱或下載權限。這種狀況一方面造成了數據的靜態化、更新效率低等問題,另一方面也不利於知識在科學共同體之間的交流和傳播。

“融合科學”則要求所有學科的科研數據在同一平臺進行開放和共享。該平臺將所有學科的學者和成果進行集中展示,打破學科之間相互交流的壁壘,允許任一學科的科研人員在平臺上根據研究主題或所關注的科學問題檢索其他學科的學者和研究成果,以便與關注同一重大問題的學者建立起直接聯繫。

2

“融合科學”要求改變傳統科研系統中忽視過程性科研數據的狀況,以實現科研全流程的數據開放和共享

傳統科研系統中僅有少數結果性的數據作為論文的相關內容公開發表,大量的過程性數據和未寫入論文的結果性數據仍然掌握在科研人員個人手中,沒有實現開放和共享,這造成了科研資源的浪費。

“融合科學”所要求的全流程的科研數據開放,包括從提出研究問題、科研方法設計積累科研數據到最終科研結果公開整個鏈條所涉及的實驗室筆記、研究數據、計算模型、論文等,這意味著研究人員可以通過蒐集全部的原始信息,真正實現在基礎數據層的交互融通。

然而,從技術手段上來看,由於過程性的科研數據,如實驗日誌、不完整的數據集、初步分析結果、科學論文草稿、下一步研究計劃、同行評審報告、與同事的溝通與交流記錄等文字資料,實驗室樣本等實物資源,以及未正式發表的結果性數據等,這些數據種類繁多且形式多樣,在存儲和管理方面存在很大困難。

目前,僅有極少數專家和機構在呼籲科研全流程數據的開放和共享,在實踐中也僅有小範圍的試點工作取得進展。例如,2014 年美國學者 Bohle在《自然》雜誌發表文章,倡議美國聯邦政府層面加大對實驗日誌開放共享的重視和投入;2018 年歐盟發佈《開放科學政策論壇建議》以來,強調科研項目的過程性數據的合理存儲和管理。

3

“融合科學”要求改變傳統科研範式下僅重視論文、專利等科研數據的開放和共享的做法,強調對解決重大經濟社會問題相關的全景式數據的開放和共享

一方面,“融合科學”的基礎數據極大地拓展了科研數據的形式和範疇。傳統科研範式下除了論文和專利數據,以其他形式存在的科研數據(如政府數據、源碼、會議資源、學術專著、教科書、新聞、存檔記錄和手稿、圖像、開放教育資源、數字化印本資源等)沒有受到足夠的重視。“融合科學”則高度重視這些不同種類的科研數據的開放和共享,特別是致力於推動創新價值鏈不同譜段上的科研數據的關聯和銜接。

在這方面,美國國立衛生研究院(NIH)建立並維護多個開放獲取的基因數據庫和臨床數據庫(包括免費開放“國際千人基因組計劃”全部數據)就是一種有益探索。

另一方面,“融合科學”也重視聯合政府數據、行業數據及廣泛的經濟社會和法律信息資源等的開放和共享,從而為聯合利用與經濟社會重大問題有關的全景數據,提供解決問題的思路或方案。

3 數據開放共享支撐“融合科學”的成功實踐

21 世紀以來,生命科學研究在攻克人類重大疾病等健康領域肩負重大使命,生命科學與信息科學、材料學的交叉融合非常普遍,這些都推動“融合科學”範式由生命科學領域的頂尖學者和機構首先提出。之後,“融合科學”範式在能源、環境、食品安全等領域的重大意義也得到認可。以下列舉的生命科學、能源、農業三大方面的“融合科學”典型案例,都證明了數據開放共享是“融合科學”成功的前提。

1 精準醫療

“精準醫療”被認為是最能代表“融合科學”的令人振奮的案例之一。“精準醫療”以更精細、更準確的疾病分類作為診斷、治療和臨床決策的基本要求,從而實現在分子學水平為臨床疾病亞型群體提供更精確的診斷和治療。

要實現這一目標,研究團體、臨床醫師、醫療保健人士及政策法規界人士需要協同合作,建立起一個開放共享的數據網絡,將生物醫學研究者所掌握的研究類數據(如基因組、轉錄組、蛋白組、代謝組、表型組等)、臨床醫師和護士掌握的臨床類數據、健康管理人員掌握的飲食和運動類數據,以及患者自身的社會及物理環境信息等連接起來,持續更新並對所有相關人員和公眾進行開放。在此基礎上,生物醫學研究者可深入理解疾病發病機制、確定疾病亞型,臨床醫師則可進一步結合患者的個體信息制定精準治療方案。

以肺癌為例,20 年之前罹患非小細胞肺癌的患者只能選擇化療方案,5 年存活率小於 10%。這是由於當時的醫生根據組織病理僅可將非小細胞肺癌進行細胞學分類(分為鱗狀細胞癌、腺癌和大細胞癌),對病情診斷和治療方案選擇的意義不大。

如今,依賴於癌症基因組學、蛋白質組學、代謝組學、信號組學、臨床標誌物研究及社會物理環境等多源數據,醫生可依據同樣的組織病理,以及進一步提供的癌症驅動因子及信號傳導通路的信息,將患者分成亞群,實現更加精確的診斷。結合臨床制定出個性化的精確治療方案,並依據臨床及分子標誌物的變化精確調整治療方案,使患者的 5 年臨床緩解率達到 60% 以上。

2 電燃料

電燃料(electrofuels)是一種通過微生物(如細菌)直接利用電能或者是氫、氨等化學物質(而不是太陽能)來獲取能量生長並生產出生物燃料的新技術。傳統上的生物燃料技術都需要直接或間接利用植物光合作用,因而需要投入大量的土地、水和肥料以獲取足夠的植物原料,生產效率較為低下。為了解決這一瓶頸問題,近些年,美國能源部高級能源研究計劃署(ARPA-E)以“融合科學”的方式資助學術界和產業界共同解決該問題,並取得重大進展。

例如,在 ARPA-E 的資助下,可再生化學品公司——OPX 生物技術公司利用嗜特異環境微生物生產出各種工業用的、富含能量的長鏈脂肪酸分子,而北卡羅來納州立大學的研究人員則開發出將脂肪酸轉化為液體燃料的化學方法。該項技術藉助於微生物、化學、合成生物學、基因工程學等不同學科領域的知識會聚,有效減少了生物質能研究中對於資源的依賴性,將生物燃料的生產效率提高了10 倍。

隨著有關微生物代謝機制相關的各類數據的進一步會聚並向不同學科背景人員進行開放,以電燃料為代表的新型生物燃料將迎來新的發展機遇;尤其是有助於篩選出具有較高能量轉換效率的嗜特異環境微生物,使得新型生物燃料的開發利用呈現出多元化、智能化和網絡化的發展態勢。

3 農業防病減災

現代農業通過傳統農學、生態學、土壤學、社會學等多學科交叉融合,改變了傳統上農業靠天吃飯的狀況,尤其是在防病減災方面取得了良好的效果。

以美國為例,惡劣天氣會對農業生產和農民收入造成損失。針對這一問題,美國 Climate Corp 公司利用美國聯邦政府數據網站免費提供的數據,如 60 年農作物收成數據、美國超過 100 萬個氣象監測站的氣象數據和 14 TB 的土壤質量數據等,開發了專門的數據軟件,為農民提供基於數據的各類農業相關服務。

例如,美國農民用戶可以利用軟件上傳農場的座標和相關信息,即可獲得農場範圍內的實時天氣信息,如溫度、溼度、風力、雨水等,再結合軟件提供的土壤質量數據,從而幫助用戶判斷每個地塊的播種、收穫、耕作時間。如果系統預測有惡劣天氣,用戶可以選擇相應的農業保險,以降低惡劣天氣對農業生產造成的影響。

以色列的現代農業技術也充分體現了基於數據來解決實際問題的融合範式。例如,以色列 Taranis 公司彙集了衛星圖像、作物實地生長報告及當地病蟲害分佈等數據資源,為農民提供可視化數據平臺,實時監測植物病蟲害風險和氣候變化。

AKOL 公司則建立了包含不同區域農民工作習慣和方式在內的龐大農業管理數據庫,依賴於土壤學、農學和社會學等專業知識的會聚,幫助農民制定更精細的種植方案,如精確霧化灌溉設備的閥值及方向、肥料及殺蟲劑使用數量等,實現農民利益的最大化。

4 未來展望

21 世紀以來,全球科技界興起兩股重要浪潮。一方面,以科技革命解決能源、資源、人口、環境等關乎人類未來可持續發展的重大問題刻不容緩。為此,國際上有關科研範式變革的呼聲層出不窮,美國提出的“融合科學”旨在倡導以一種新的科研範式來解決重大經濟社會問題,從而給科研組織、數據基礎和相關政策等方面帶來了新的圖景。

另一方面,有關科研數據公開化的呼籲也聲勢浩大,“開放獲取”“開放數據”“數據共享”“開放科學”等共同在科技界推動了科研數據開放理念的普及,在實踐中也推動了數據開放平臺的建設和運營。

本文認為,推動重大經濟社會問題的解決需要將這兩股浪潮進行連通。一方面,要真正實現“融合科學”所具有的多學科交叉融合、創新價值鏈貫通融合和不同權益相關方的協同融合,需要從底層數據上將跨學科、跨部門、跨領域、跨環節的數據進行合理的存儲、開放、管理和共享。

另一方面,當前與“開放數據”有關的倡議和實踐重在強調數據的開放,但是缺乏對數據開放會為經濟社會帶來什麼效用的思考。事實上,如果將當前“融合科學”和“開放數據”的發展結合起來,以“開放數據”支撐“融合科學”的實現,以“融合科學”帶動“開放數據”更好地在解決重大經濟社會問題方面發揮效用,將為人類未來可持續發展帶來不可估量的正面推動作用。

當然,要實現“融合科學”與“開放數據”的連通並非易事。從技術層面來看,要實現“融合科學”所要求的全學科、全流程和全景式的數據開放,無疑是對人們現有的數據存儲、管理和開放技術都提出了挑戰。所幸的是,當前一些符合“可查找(findable)、可獲取(accessible)、可相互操作(interoperable)和可再利用(reusable)”(FAIR 標準)的跨學科數據開放平臺已經運行,美國 ORCID(開放研究者與貢獻者身份碼)平臺也為每一位研究者提供了一個唯一的、全球通用的標識符。

同時,多學科交叉融合也已經催生了一系列顛覆性技術的誕生,如 DNA 數據存儲技術和人工智能技術。未來有望通過完善此類新技術來實現“融合科學”所要求的數據開放物理設施和服務架構要求。此外,重大經濟社會問題的導向下,全球科技界的視野也進一步開放,有利於與其他公共部門(如政府部門)進行數據連通。這些都為未來構建符合“融合科學”的基礎數據,支撐從傳統科研範式到以重大問題解決為導向的“融合科學”新範式的轉變提供了技術上的可能性。

此外,實現“融合科學”所要求的“開放數據”,還需要政府部門、科研資助機構、學術機構、數據平臺商、科研人員等通力支持。

1 從政府部門來看

當前政府數據公開已經取得重要進展,一些國家陸續發佈了推動政府數據公開的政策文件。例如,中國 2015 年印發《促進大數據發展行動綱要》,要求“2018 年底前建成國家政府數據統一開放平臺”;2018 年印發《國家科學數據管理辦法》,並陸續支持 20 個國家科學數據中心。

2 從科研資助機構的角度來看

目前若干資助機構已經對項目承擔方提出了公開其承擔項目產生的科研成果和數據的強制性政策要求,未來需進一步推動此類政策的全面鋪開。例如,2017 年起歐盟“地平線計劃”(Horizon 2020)要求所資助項目必須參與研究數據(包括統計資料、實驗結果、測量值、實地觀測結果、調查結果、採訪錄音和圖像等)的開放獲取,以便其他人員能夠通過知識庫訪問、挖掘、複製和傳播科研數據。

3 從學術機構的角度來看

一方面需要改變對科研人員的評價和激勵制度,鼓勵那些將科研成果和科研數據進行開放的科研人員;另一方面應根據機構特點適時建立機構層面的知識庫,引導和培訓科研人員進行數據的標準化存儲和開放。

4 從數據平臺商的角度來看

目前學術期刊的開放獲取已經取得重要進展,一些主流學術出版機構(如美國化學學會和英國自然出版集團)等都已陸續加入開放獲取行列;Zenodo和 Figshare等其他類型(如圖像、視頻、軟件、代碼等)的科研資源數據平臺也陸續上線。但是,如何在這些不同平臺之間建立起關聯(如通過類似於美國 ORCID 的數據標識)從而形成一個跨學科、跨界的數據平臺還有待開發和完善。

5 從科研人員來看

科研人員既要調整價值導向,倡導以解決重大經濟社會問題為根本使命的文化,也要在數據開放方面接受一定的數據存儲、管理和使用上的培訓,使之轉變傳統觀念,從以往僅重視論文的發表轉變為將數據也作為重要科研資源進行開放和共享。

肖小溪 李曉軒:“融合科學”新範式及其對開放數據的要求

肖小溪中國科學院科技戰略諮詢研究院助理研究員。主要研究領域:科技管理與評價。2014年畢業於中國科學院大學,獲得管理科學與工程專業博士學位。近年來主要承擔來自中國科學院、國家自然科學基金委員會等的科研課題。圍繞科技評價、科技政策等主題在國內核心期刊發表學術論文10餘篇。

肖小溪 李曉軒:“融合科學”新範式及其對開放數據的要求

李曉軒中國科學院管理創新與評估研究中心主任,中國科學院科技戰略諮詢研究院研究員,博士生導師。現任北京市政協委員。主要研究領域為科研管理,涉及科技評價、科技人力資源管理、科研經費管理等研究方向。長期從事政府科技管理與政策方面的決策支撐研究工作,近年來主要承擔來自中國科學院、國家發展和改革委員會、財政部、科學技術部、國家自然科學基金委員會等重要科研課題。撰寫了大量研究報告和研究論文。

文章源自:

肖小溪,甘泉,蔣芳,陳捷,李曉軒.“融合科學”新範式及其對開放數據的要求.中國科學院院刊,2020,(1):3-10.

總監製:楊柳春

責任編輯:張帆

助理編輯、校對:PAN

排版:筱小鹿

肖小溪 李曉軒:“融合科學”新範式及其對開放數據的要求
肖小溪 李曉軒:“融合科學”新範式及其對開放數據的要求


分享到:


相關文章: