科學匠人|用數學邏輯來優化工作和人生

科学匠人|用数学逻辑来优化工作和人生

編者按:從數學博士到投身計算機科學研究,微軟亞洲研究院機器學習組主管研究員陳薇將理性嚴謹的數學思維融入到了工作與生活的方方面面:在研究領域,陳薇以她堅實的數學背景與研究團隊一起從事機器學習理論和算法優化的研究,為機器學習的加速發展奠定了有力的理論基礎;在生活中,她也用數學思維來不斷優化自己的人生。

數學博士陳薇是位知性、溫婉的女性研究員,常年的數學思維訓練,讓她很善於用各種模型去解釋生活中的大小問題。在她看來,“如果把人生看成一個優化問題,那麼只有影響力能成為其目標。”自選擇做計算機科學研究的那一天起,研究的影響力便成為陳薇追尋的目標。在加入微軟亞洲研究院後,陳薇與合作者們一起從理論上理解機器學習方法並改進算法,先後在排序學習、博弈機器學習、分佈式機器學習、深度學習和強化學習理論等機器學習的各個分支取得了多項重要研究成果,為機器學習的加速發展奠定了有力的理論基礎。

“頂天立地”的數學思維

2008年8月5號——北京奧運會開始的前三天,陳薇因為她在中科院的導師與微軟亞洲研究院的聯合科研項目,開始了在微軟亞洲研究院的實習。當時陳薇主要做的是與複雜隨機網絡相關的課題,併為此提供一些算法的理論分析。2010年陳薇的實習結束,優異的她獲得了微軟亞洲研究院的Offer,但讓她有些猶豫的是,像她一樣學數學的同學在當時大多都選擇去了高校或金融機構,跨界到計算機領域可算是同學中的獨一份。

在這個抉擇的過程中,陳薇當時的Mentor、現任微軟亞洲研究院副院長劉鐵巖博士給出了幾條建議,令她記憶猶新:一,無論在什麼組織裡,最重要的都是體現自己的價值,不要因為體制不同、有陌生感,就擔心、害怕,在哪裡都是做研究,與體制無關;二,對於行業問題,在高校做研究一般按照自己的知識體系前行,基於自己技術積累的程度,去尋找相應的研究問題,但在微軟亞洲研究院,你會發現因為基於微軟這個平臺公司,這裡永遠不缺少計算機科學問題,而且這裡還有大量的數據,所以數學在這裡也有很大的發揮空間——可以把問題抽象出來,然後利用數據再把它的Pattern(模型)找出來;三,與聰明人為伴,或者說是與能夠讓你進步的人一起工作。

科学匠人|用数学逻辑来优化工作和人生

微軟亞洲研究院主管研究員陳薇

彼時,在微軟亞洲研究院實習了兩年多的陳薇已經對微軟亞洲研究院相當瞭解,並且學到了不少技術和方法論。“數學的本質就是一個把問題抽象出來,利用數據和數學邏輯進行推理建模尋找規律的過程。微軟亞洲研究院作為一個頂級的研究機構,所面臨的問題也是來自前沿的挑戰,在這裡你完全就是站在計算機科學研究的最頂端。”因此陳薇決定加入微軟亞洲研究院便無懸念。現在回想起來,陳薇覺得自己可能一直就有那麼一股願意解決各種問題的衝勁兒,而這股力量後來又推動她攻克下了一個又一個難題。

陳薇面臨的第一個難題就是排序項目,當時業界已經有了很多排序算法,同時也有很多排序的評價準則。但陳薇和同事們卻發現,那會兒訓練模型的算法是一套,而評價準則卻是另外一套,於是他們試圖打通其中的關聯,從而完善整個體系。在研究的過程中,擁有數學背景的陳薇不僅設計了全新的本質損失函數,找到了更好的算法,而且對於走在前面的算法,她還給出了理論上的解釋,去發現還有什麼可以改進的空間。就這樣,訓練模型和評價準則之間的關係便有解了。陳薇也第一次在計算機領域的研究中,深刻地體會到了數學的用武之地。

科学匠人|用数学逻辑来优化工作和人生

排序算法中的本質損失函數

相反,對算法問題進行數學拆分,再逐步研究其中的優化空間,則是陳薇利用數學思維開闢出的蹊徑,同時,這也是陳薇做分佈式機器學習的思路。事實上,分佈式機器學習與傳統分佈式計算有本質區別,因為它是一個迭代式的優化算法。用分佈式計算去做機器學習,就要把問題一步步細化,比如數據怎麼分、本地間如何交互、如何合併成模型、什麼時候通信、如何通信等等,當把整個分佈式框架拆分開來,優化的路徑也更為清晰。在陳薇看來,這正是數學的體系化思維帶給她的優勢。

關於數學思維,陳薇認為它是一整套的體系化思考和觀察角度,與之相應的方法論,就是她的導師中科院數學院馬志明院士常教導的——做應用數學的學生們要“頂天立地”。馬老師常說:“做算法做到最後需要去理解它背後的數學機理是什麼?它的理論保證是什麼?除了實驗上的嘗試之外,我們還要證明一些東西,去改進它。這樣就有機會產生顛覆性創新思維,做到勝人一籌,這叫做‘頂天’。與此同時,在實驗過程中,不斷髮現問題、優化問題、解決問題,使得算法能真正解決實際問題,這就是‘立地’。”“頂天立地”四個字陪伴著陳薇在微軟亞洲研究院走過了10年,也讓她在之後的諸多跨界研究中有了底氣。

跨界研究是創新的開端

陳薇的數學專業方向是概率統計,偏向於連續數學。但在她正式加入微軟亞洲研究院之後不久,她所在的小組調整了研究方向——研究屬於博弈論範疇的廣告拍賣機制。博弈論具有離散組合數學的屬性,與連續的概率統計技術相差很大。幾乎陌生的研究領域起初讓陳薇有些畏難情緒,因為這意味著她要從頭學習博弈論的所有理論基礎。但作為當時組裡唯一一位數學專業出身的研究員,陳薇開始組織大家閱讀、學習相關文獻著作,漸漸投身研究。

傳統的廣告詞購買,數據匹配通常不夠精確、靈活,遇到關鍵詞有多種意思時很容易混淆,比如蘋果,可能是指水果,也可能是指電子產品,但無論廣告主投標的是這一關鍵詞的何種含義,其廣告都會被混在一起打包投放。這種拍賣機制中並不存在納什均衡,系統的穩定性較差,博弈論關心的兩個目標社會福利和平臺收益也無從保證。為了解決這個問題,陳薇及其合作者設計了全新的概率廣義匹配拍賣機制,根據數據設計概率將關鍵詞匹配至更細緻的含義中,使得系統存在性質優良的納什均衡。經過兩年的時間,這一研究成果最終被計算機經濟學領域最權威的學術會議ACM EC接收。

科学匠人|用数学逻辑来优化工作和人生

概率廣義匹配拍賣機制

同時,陳薇也在思考如何用機器學習算法設計機制。不同於傳統的監督學習,博弈問題中的行為數據會隨著策略的變化而變化,學習算法所需要必備的泛化性能受到挑戰。陳薇及其合作者引入行為學習模塊,用來模擬行為數據的變化,然後設計機制學習模塊學習最優機制。他們證明了如果行為模型是馬氏的,學習算法仍然具有良好的泛化性能。他們稱這一針對博弈論問題具有良好泛化性能的算法“博弈機器學習”。

科学匠人|用数学逻辑来优化工作和人生

博弈機器學習

陳薇表示,博弈機器學習這個項目完成之後,涉及任何數學分支的研究她都敢去接觸,無論自己之前在某個或某些領域的積累有多少,但如果遇到新的問題,需要去“啃”新的技術和理論,那也沒有什麼可怕的。在她看來,這樣的學習能力,也是做一個研究員所必須具備的基本素質。

誰說深度學習沒有理論?

2014年左右,陳薇在劉鐵巖博士的鼓勵下開始研究深度學習理論。深度學習理論研究是知名的硬骨頭,當時業界有一個說法就是“深度學習沒有理論”。所謂“沒有理論”,是因為過去從來沒有人提出相應的理論,業內整體對此也很迷茫。幾十年前就已經被提出的神經網絡概念,在近十年再度覺醒,一下成為了風靡業界的寵兒,整個學術圈都在追求設計出更大、更好的深度學習模型,但始終忽略了對其背後理論的探索。

這個工作非常重要且意義非凡,因此劉鐵巖博士極力勸說陳薇去嘗試探究。但因為此前沒有人做過對深度學習理論的研究,所以其難度可想而知,沒有任何可參考的資料和思路,一切完全都要自己去理解和創造。

陳薇坦言,每次遇到嶄新的考驗,她都會懷疑自己的堅韌,而每當這種時候,劉鐵巖博士總能幫她將顧慮一條條釐清,克服障礙。“這或許就是Mentor的含義,微軟亞洲研究院就是這樣靠著Mentor,靠著一群志同道合的聰明人,一代一代傳承下去”陳薇說。

於是,劉鐵巖博士又給陳薇提出了三個建議:一,要從更高層次的角度去思考問題,這是學數學的同學需要特別注意的地方,因為數學證明很容易陷入到細節裡去,這種時候需要能夠跳出來看問題,從更高的層面去把握小問題之間的關聯;同時學習傾聽你的直覺,在舉棋不定的時候,可能直覺會告訴你應該朝哪個方向走,而這對數學證明也會有幫助。二,要樹立一個特別特別高的目標,不要覺得這是個開放問題就放任不理,去做你覺得應該做的,去做真正有影響力的事情,哪怕它很難。三,不斷學習,需要用到什麼就學什麼,要有針對性地學。

2016年,陳薇及其合作者用間隔理論解釋了深度學習中網絡層數的作用。近兩年,學術界和業界開始普遍關注深度學習的理論問題,而她和團隊已經進一步向前,從更加大膽的視角去剖析深度學習理論。

科学匠人|用数学逻辑来优化工作和人生

陳薇(左二)、劉鐵巖(左三)與團隊成員

人生的優化公式,不要把"約束”錯當成“目標”

“影響力”這個詞讓陳薇找到了她的目標所在。在工作中,尤其是做研究,影響力是最核心的評價指標,雖然在微軟亞洲研究院並沒有具體的KPI,但每位研究員都在致力於做出具有影響力的研究和項目。而在生活中,陳薇也借鑑了“影響力”這個概念。

正如文章開頭所說,陳薇覺得人生也可以用數學邏輯去優化,她發現人們在尋求最優值的過程中有時會走彎路,常常把數學模型中的約束(Constraint)錯當成了目標,這裡的約束,有時候是婚姻,有時候是子女,有時候是“剩者為王”的社會壓力。“我們見過太多的啟程,因為某種‘和解’半途而廢,而這時調轉馬頭所朝的方向,早已不是出發時的目標。”所以當你急著趕路,要去向某個終點的時候,不妨時常靜下心來想一想,那是“約束”還是真正的“目標”?

你也許還想看

科学匠人|用数学逻辑来优化工作和人生

感謝你關注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:[email protected]


分享到:


相關文章: