12.11 科學發現背後所隱藏的知識網絡

任何科學進展都源自前人無數的研究,它們形成了一種“隱形的知識網絡”。研究人員著手將這些網絡繪製成圖,使隱形的知識發展歷程更為直觀,併為後來者指點繼續前行的方向。

重大發現從來不會憑空出現,在任何一項科學成就背後,發現者的才能與前人在該研究道路上留下的足跡同等重要。

當然,這也不算什麼奇聞……新鮮之處在於,長期以來各種科學發現組成的隱形網絡如今可以通過一些極其精確的示意圖表現出來了,因為在信息時代,獲取並分析大量數據已非難事。這些圖為我們展示了一個新大陸:科學發現背後所隱藏的知識網絡

就像冰山的水下部分終於露出水面,知識網絡的結構、其覆蓋範圍、內部織就的各種聯繫、研究熱點及未開墾領域被一一揭示,而示意圖也意味著新探索和新發現的可能性!

研究人員、統計學家和圖示專家通力合作,希望進一步將這種新型圖表運用於各個科學領域內部,因為科學研究的幾乎所有層面都有網絡結構,無論是某一發現背後的知識網絡,還是分子生物學中的基因與蛋白質的關係……

科学发现背后所隐藏的知识网络

目標都一樣,即以一種一目瞭然高度綜合的方式,展現出由數千至數十億不等、存在相互作用的對象所構成的某個系統的結構和機能。

例如,一個對生物體新陳代謝至關重要的蛋白質背後,是一張巨大的DNA和RNA片段的網絡,這些片段相互作用,才最終合成該蛋白質。研究人員將根據採集到的大量數據,通過一些算法確定在該蛋白質形成過程中起作用的基因“組合拳”,得出極其複雜的圖表,其中即隱藏著該蛋白質合成網絡的關鍵特徵。

最後的任務就是要把這張網絡關係圖畫出來。

怎麼畫呢?

“節點和連線的表現方式是最常用的,但超出一定的複雜程度就無法看清了。”法國國家信息與自動化研究所 (INRIA) 分析與視覺化實驗室 (Aviz) 研究主任讓-丹尼爾·菲柯特 (Jean-Daniel Fékété) 提醒道。

科学发现背后所隐藏的知识网络

那麼該以哪些數據為重點,又如何呈現它們之間的關係呢?

這一選擇取決於研究本身的目標 (如期待發現與某疾病高度相關的基因)、所需進行的統計分析 (如節點的連通度、連線的疏密程度等)以及數據轉化為視覺語言、讓研究人員一目瞭然的潛力。

我們知道,圖示法擁有一張絕對的王牌——前注意感知 (preattentive perception),即人類視覺系統在圖像中毫不費力且毫無差錯地瞬間捕捉到一些基本特徵的能力。利用這一絕妙特性,有效地呈現數據間的關聯,便可使看圖者的眼睛在迅速分析方向、密度、顏色的聚集和反差之後,立即發現該系統網絡的特點,隨即對此進行闡釋。

下文將介紹一些近幾年最具代表性的網絡關係圖。涉及課題包括基因間的相互作用、知識的組構、科學發現的動態變化等。在研究人員和數據圖示專家的通力合作下,這些複雜系統的呈現得以簡化,科學深處隱藏的種種筋絡展露無餘。

基因和蛋白質的關聯圖

生物學教材告訴我們,遺傳信息從DNA轉錄到RNA上,RNA進而翻譯合成蛋白質。然而實際上這個過程更復雜一些:DNA轉錄產生RNA片段,這些片段相連形成嵌合RNA (chimeric RNA),由嵌合RNA合成蛋白質。

因此,蛋白質的真正源頭隱藏在RNA片段網絡之內,而RNA片段本身又源自基因網絡。

科学发现背后所隐藏的知识网络

上方圓盤狀示意圖所呈現的正是這一基因的網絡:圓盤外圍標記了人類22號染色體的所有基因,內部連線則意味著其兩端基因組成一個嵌合RNA。

連線越是貼近圓盤的直徑,組成嵌合RNA的兩個基因相距越遠。巴塞羅那基因組調控中心的研究人員通過對492種蛋白質的編碼基因進行分析,發現其中85%的基因需要互相作用才能合成蛋白質。

而基因之間的連接也非偶然 (連線分佈密度在圓盤表面是不均勻的),這表明嵌合RNA的產生並非隨機,應該遵循一定規律……而這一規律則有待人們去發現。

科學概念地圖

天體物理學“小島”與量子物理學之間的聯繫十分緊密,社會科學“群島”與信息技術之間的互動非常密集,研究生命的各學科織成了巨大的花體字……這便是這張科學概念“地圖”所顯示的一些信息。該“地圖”將科學各領域之間的聯繫都涵蓋在內,其繪製工作可謂壯舉!

科学发现背后所隐藏的知识网络

圖中,每一學科領域均顯示為不同顏色,每個節點標記一個概念 (比如“量子物理”領域裡的“玻色-愛因斯坦凝聚”),連接各概念的連線長短則表明這些概念間的親疏程度。湯森路透 (Thomson Reuters) ——原美國科學信息研究所 (ISI) ——是一個彙集成千上萬科學文獻的數據庫,研究人員對其中收錄的共約80萬篇2003年度發表的論文進行了分析,甄選出776個“主要範式”繪製成這張地圖。

所謂“範式”即在主要學科內屢屢涉及的的一些重要概念,定義範式的標準就是各文獻之間交叉引用的數量。基於其他年份權威科學刊物的相同操作證明,2003年的這張地圖可靠度非常高,因為主要領域及其相互之間的聯繫或多或少保持著原樣。今後,這張地圖會隨著新的科研文章的不斷髮表而定期更新。

人類知識地圖

“維基百科”構建的知識大廈與學院派知識大廈的區別何在?

科学发现背后所隐藏的知识网络

通過上面這幅雙球圖,我們得以瞭解大概。該圖展現了兩個知識庫中各主要領域的知識儲量以及它們相互之間的關係,左半圖為“維基百科”勾勒出的藍圖,右半圖為通用十進制圖書分類法 (UDC) 得出的學術地圖——該分類法為世界半數大型圖書館所使用,它將人類知識分為9大類目。

為了比較這兩大體系,荷蘭知識空間實驗室 (Knowledge Space Lab) 的研究人員把“維基百科”的234960個詞條劃分為43個大板塊,並將這些板塊歸入十進制圖書分類法中所對應的門類,總結出61705個節點 (節點表示各詞條之間的關係),而十進制圖書分類法9大類目共得出68546個節點。

圖像表明,這兩個知識網絡具有相當的差別。十進制圖書分類法涉及的知識有75%屬於科學範疇,而“維基”詞條所覆蓋的領域更為多元,如藝術便在其中佔據了相當大的比重。

發現成果之影響示意圖

研究人員總是“站在巨人的肩膀上”,他們的各項新發現離不開前人的成就。這張示意圖可同時展示一項新發現所受過往研究的影響和這一成果對於其後科研工作的影響。

科学发现背后所隐藏的知识网络

具體地說,這張圖呈現的是1982年至2010年“人機互動及用戶界面國際研討會”上所發表的論文之間的關係。

每一個年份 (縱列) 中的每一篇文章都與其前作為參考資料的論文以及其後引述該文章的論文相連,因此我們一眼就能找出那些生髮出許多其他研究的論文 (證明這些論文闡述的是真正有趣的觀點,見大圖),

科学发现背后所隐藏的知识网络

和那些影響甚微、最終不再受到關注的研究 (下圖)。

科学发现背后所隐藏的知识网络

總之,這裡列舉的11699份研究勾畫出該研究領域的全部歷史。這張示意圖可在網上查閱,並隨意放大,其設計者希望今後能將該方法擴展至其他科研領域。

撰文 Gayané Adourian

François Lassagne

編譯 朱琳

科学发现背后所隐藏的知识网络


分享到:


相關文章: