陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

曉查 栗子 發自 凹非寺
量子位 報道 | 公眾號 QbitAI

在科學探索的過程中,“重複造輪子”從來就不新鮮。

最知名如牛頓和萊布尼茨,各自獨立發明了微積分;而計算機領域,也有圖靈和邱奇先後提出通用計算機理論。

就在近期,天才數學家陶哲軒也經歷了類似事件。

今年8月, ,從一個矩陣和子矩陣的特徵值求出特徵向量。

他們以為自己的研究是首創,卻被學界同行察覺到,早在2014年,論文裡的公式就已被另一位荷蘭學者發現,而這個公式的雛形最早可以追溯到1968年。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

經過網友的提醒,陶哲軒在個人博客評論區承認:這篇5年前的論文和自己參與的新論文,描述的規律是一樣的。

陶哲軒表示,推導出上面的公式並不難,但是由於每個人使用的符號不同,加上搜索數學公式的困難,遺憾之前沒能發現前人的研究。

除了陶哲軒以外,三位物理學家之一的張西寧也在個人社交平臺作出說明。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

他提到論文發表時沒有關注到前人的成果,現在已經給論文添加了關於早前工作的說明和參考文獻,並修改了“首創性”部分的措辭。

講到這裡,量子位需要做一個說明。我們最初是從Quanta Magazine的推文而關注此事,然後繼續研究了相關的預印版論文以及相關博客,並在14日中午完成中文報道。由於刊發時間安排,這一報道15日中午發出。

在此過程中,我們沒有注意到14日晚間Quanta Magazine在報道最後附上了更新、陶哲軒在博客評論中也談及此事。這也導致我們在15日發佈文章時,沒有傳遞出這一信息,在此對各方和讀者表示歉意。

至此,事件算是有了階段性發展結果,實際是陶哲軒與另外3位物理學家重新發現了該定理,並且因為陶神名氣,讓“老”公式煥發了“新”活力——使得該公式得到了前所未有的關注和討論。

因為陶神加持,熱議前所未有

事件的起因,源自三位物理學家在研究中微子振盪時發現,只需要用矩陣和子矩陣的特徵值,就可以求出特徵向量中,各個分量的平方。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

他們把這個在3×3矩陣中得到的特殊結果,發給天才數學家陶哲軒。

陶哲軒在收到物理學家們郵件發來的成果之後,被這個簡單整齊的公式震撼了,還給出了三個證明。後來就有了那篇四人聯合發表的論文。

交叉領域的新發現,又有陶神加持,一石激起千層浪。

成果發表後,先後在英文和中文網絡社區引發了熱議。

最早是一位來自萊斯大學的女博士生Manjari Narayan指出,陶哲軒發現的這個公式早在2014年就已經在被一位荷蘭學者Van Mieghem提出過。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

而且Van Mieghem不是唯一的發現者,該公式在歷史上被多次獨立重複發現和命名過。

於是也為圍觀者指出“並非新發現”埋下伏筆,進一步有了上文所述的陶神回覆。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

但陶神也坦承,自己之前從來沒有看到過這項研究:

據我所知,這個預印本沒有正式發表過。而且作者特別聲明過,這個結論前人也發現過幾次,但都沒有傳播到更廣泛的受眾裡去。

陶神還在個人博客中詳細列出了9個曾發現過此公式的文獻。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

陶神也進一步總結經驗、給出建設性呼籲:

看上去,這個規律一直沒有受到大規模的關注。我也希望數學能有一種更好的語義搜索引擎,不然除了發佈自己的論文,等別人去發現和從前的研究有什麼聯繫,也沒有別的辦法。

所以由此可見,一個數學規律能夠橫跨50年,不停地被科學家們當做新的發現寫成論文,如今終於被全世界知曉,過程中的曲折離奇,確實也值得單獨討論。

在這之中,每一次獨立發現——也包括三位物理學家與陶哲軒發表的成果,既是科學家不斷追求認知世界的結果,但也有學術交流時空地域侷限帶來的“重複造輪子”的無奈。

當然,這次的發現其實也不是完全“重複造輪子”。

Hacker News論壇討論中,還有人提到,新研究與2014年那項研究實際有差別:

2014年的研究和陶的方法差不多,但在面對實數的時候,那項研究並沒有把這種聯繫,推廣成特徵向量和特徵值之間的完全相關性 (Full Correlation) 。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

陶神等人的發現,讓這個沉睡多年的公式得以再次重見天日,也引發了學界對該公式更深層次的探討。

討論還在更進一步

3位物理學家與陶哲軒將論文公佈在Arxiv上,並且命名為Eigenvectors from eigenvalues,意為從特徵值獲得特徵向量。這也引起了不小的爭議。

標題只有三個單詞,似乎論文中的規律更具一般性,但是這種描述準確嗎?一位讀者向陶哲軒提出了疑問。

他認為,該公式並不能給出特徵向量各個分量的確切值,只能求出範數的平方,我們仍然不能知道分量的正負號。

那麼,直接說從特徵值求出特徵向量,是否有誇大的嫌疑?

對此,陶哲軒表示,標題確實是一個過分的簡化(oversimplification)。

但是這種表述比“特徵值與特徵向量係數範數的平方”更簡潔地傳達了結果的本質。陶在論文摘要裡對這個公式的意義做了更為準確的闡述:

我們將特徵向量元素範數的平方與特徵值和子矩陣特徵值聯繫起來。

另外,論文中的公式並不是針對所有形式的矩陣,而只是對厄米矩陣(Hermitian Matrix)才成立,也讓一些讀者對公式的普適性表示懷疑。

什麼是厄米矩陣?第i行第j列的元素與第j行第i列的元素互為共軛複數(實數部分相同,虛數部分相反)。例如:

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

厄米矩陣的一個重要性質是它的特徵值必定是實數。在量子力學中,矩陣的特徵值往往會對應著某個真實的物理量:能量、粒子數等等。

物理學用到厄米矩陣的情況更多,在原本研究中微子振盪的論文裡,3位物理學家用到的就是一個3×3的厄米矩陣,並且從這個特殊的情況推測出更普遍的結論。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

跳出物理學,非厄米矩陣的情形更為常見,如果公式不能用在其他情形中,其實用性也會大打折扣。

對於是否可以把全篇論文推廣到更一般的情形,有人給出了一種猜測的結果:

將方程中vi,j範數的平方改成:第i個特徵向量的第j個分量,與矩陣A的厄米伴隨矩陣的特徵向量的第j個分量的共軛乘積。

陶哲軒給出了正面的回答:在他的第三種方法,也就是用克萊默法則的證明方法中,應該可以將公式擴展到非厄米矩陣的情形。

即便是隻能用於厄米矩陣,那麼陶的方法對於對計算機求解特徵向量是否仍有實際意義?

已經有讀者用NumPy實現了陶哲軒的公式,並且用該方法將計算結果精確到小數點後6位。希望未來這種方法可以用在計算機的矩陣運算中。

接下來如何去驗證特徵向量各個分量的符號,則是另一個需要解決的問題。

陶哲軒表示,該公式在數值計算中的意義有限,這種方法先計算出向量分量的模,再計算出符號,會將計算成本增加大約2倍。

此外,還有更多的討論者思考如何進一步應用。

比如浪潮AIHPC物理學博士Jerry就評論:

陶哲軒和物理學家的新數學公式沒有唯一解,應用範圍有限。

昨天就看到了,其實核心思想就是遍例,需要原厄米矩陣的信息,簡單試試是沒問題的,前提必須知道原厄米矩陣,否則沒意義,對很多物理問題可能無法得到全原厄米矩陣。

在一定程度上對特定物理問題可降低計算強度,不過計算訪存比會降低,內存帶寬會進一步密集,是否有普遍實用價值不好說,感覺這個就是個數學遍例,沒特別顛覆性的影響,而且原文也只是說物理問題,其他領域能不能擴展真不好說。

從昨天推導看,它不能唯一算出本徵矢,原因是缺相位,所以應用範圍有限,只是一種思路而已。

多說幾句,這個方法的本質其實就是使用原厄米矩陣的本徵值和子矩陣的本徵值共同作用來計算出原厄米矩陣的可能的本徵向量,因此它其實還是需要原厄米矩陣的信息在裡邊的。如果需要計算全部的本徵矢,就需要所有的子矩陣,計算量減小一部分,當然也沒有少很多。

由於厄米矩陣的相似變換都是可能的本徵矢,而這種方法計算缺少相位信息在裡面,所以所說算出的本徵矢並不唯一。目前所能應用的範圍領域是有限的,原文只是給出了中微子領域的一個應用,其他領域能否應用並不好說。

還有其他研究者認為:在機器學習裡,感覺可以用來處理缺失feature,假設原矩陣本徵值已根據大量數據算出,在新場景下,即使某些樣本/feature缺失,也可以粗略算出本徵矢,壓縮和分類可以更準確。

總之,雖然“新發現”出現反轉,但也在傳播中形成更大的討論和思考,功不唐捐。

而且三位物理學家和數學家陶哲軒的跨學科協作、在被質疑後的嚴謹求實態度和虛懷若谷風範,也讓更多圍觀者經受了一次學術精神洗禮。

事件產生的影響,已不侷限於數學物理研究本身。

搜索公式,任重道遠;開放交流,非常必要

當然也有另一維度的啟示。

有網友就感慨說,即便像陶哲軒這樣的世界最頂尖數學家,也可能對某些數學知識存在遺漏可能。

這一方面是學科知識不斷大爆炸的結果,開放性學術交流顯得愈加有必要性。

另一方面,基礎學科——如數學公式搜索、查重等工具也愈加迫切。

在3位物理學家與陶哲軒引爆這一公式之前,“它”已經在1968年以來被發現了N次,但這幾位學者卻對此難以知曉。

那麼有沒有更好的方法,可以搜索數學公式、給公式查重?

目前還沒有。

雖然現在的語言類AI已經能寫出接近人類的小說,但對數學公式的理解還停留在小學生階段。

今年年初,DeepMind給AI學習了200萬道題,結果AI在做四則運算時的正確率只有50%。所以就更不必說讓AI去理解和搜索更高階的線性代數的公式了。

所以即便在經歷重大技術躍遷,但在認知世界、探索未知的路上,我們還有不少工作要做、不少挑戰要解。

而且還有很多基礎性工作,需要頂尖科學家的絕世大腦——即便頂尖AI也需要他們。

有網友在完整經歷這一次“反轉”後表示,也感受到陶哲軒等科學家身上求實嚴謹、聞過則喜的精神,更加尊敬。

One more thing

最後,也有不少年輕一代學生好奇:陶哲軒是誰?

這裡有一則陶神軼事,或許能為這位天才數學家一個小小小小的註釋。

先從這樣一個問題說起:

想象你被困在一個房間裡,一同被困的還有一頭飢餓的獅子。你和獅子都是房間裡的點。

假設獅子可以跑得比你快,你也可以跑得比獅子快,且你和獅子可以用同樣的速度奔跑。

如何才能避免被吃掉?

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

這樣的問題,在數學和計算機科學領域,叫做追逃博弈 (Pursuit Games) 。

在1984年、陶哲軒還只是9歲的時候,普林斯頓大學教授、菲爾茨獎得主查爾斯 · 費夫曼 (Charles Fefferman) 就問過他這個問題。

那段時間,陶哲軒的父親陶象國,帶著他去拜訪世界各地的偉大科學家,想要確認兒子到底是不是有天分。

而與費夫曼教授一同在場的,還有另一位菲爾茨獎得主——恩里科 · 邦別裡 (Enrico Bombieri) 教授。

當時為了更好地描述問題,邦別裡教授甚至突然站起來,學著獅子吼,然後追著陶哲軒滿屋子跑。在這樣氛圍裡,9歲的陶哲軒機智地給出了答案。

陶哲軒證明的“新公式”,成了重複造輪子?事情並沒有這麼簡單

時隔多年後,費夫曼教授如今已經不記得9歲男孩給的答案具體細節。

但他依然記得那時的震撼感,因為陶哲軒答出了一個任何課堂裡都不會被問到的問題。

此後,陶哲軒在10歲、11歲、12歲先後參加國際數學奧林匹克競賽,分獲銅牌、銀牌、金牌,分別是金銀銅牌最年輕得主的記錄保持者。

16歲獲學士學位,17歲獲得碩士學位,21歲獲得普林斯頓大學博士學位。

24歲,陶哲軒成為加利福尼亞大學洛杉磯分校(UCLA)終身教授。

31歲,陶哲軒斬獲“數學諾貝爾”之稱的菲爾茨獎。

現在,1975年生的陶哲軒也才44歲,是全世界最知名的華人數學家之一。

傳送門

陶哲軒博客:
https://terrytao.wordpress.com/2019/08/13/eigenvectors-from-eigenvalues/

陶哲軒和3位物理學家論文地址:
https://arxiv.org/abs/1908.03795


https://arxiv.org/abs/1907.02534

2014年荷蘭學者Van Mieghem的論文:
https://arxiv.org/abs/1401.4580

外媒源報道:
https://www.quantamagazine.org/neutrinos-lead-to-unexpected-discovery-in-basic-math-20191113/

量子位報道:


量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態


分享到:


相關文章: