2018-07-16 10:57:43 DT財經

作者 | 陳靜

題圖 | 站酷海洛

張智林，美國加州大學聖迭戈分校電子與計算機工程系博士，曾在三星北美研究院擔任高級工程師，現為AT&T首席數據科學家。憑藉在算法上的創新，他用三年實現了個人財務自由，如今帶領著AT&T（美國電話電報公司）數據科學團隊，向被谷歌、臉書等巨頭霸佔的廣告市場，發起了挑戰。

近日，中美兩國貿易摩擦愈演愈烈。雖然身在美國，張智林一直都很關注著國內的各項動態。從芯片之爭到股市行情，在這位數據科學家看來，一波又一波的中美大小事，讓他更加意識到“創新”的重要性。

“中國在很多基礎領域的創新還非常薄弱，這使得我們在貿易戰中被美國掐著脖子，這在我看來是一件很‘屈辱’的事。”張智林說道。

對於張智林自己來說，“創新”始終都是他生命中的關鍵詞，貫穿了他職業生涯的每一個階段。

▍喜歡“唱反調”的博士

張智林認為，所謂創新，就是去找到別人沒有做過的方法，想出別人沒有想過的東西。

在張智林身上，這種創新精神，有時候是以“唱反調”的方式表現出來的。在美國讀博時，他主要研究壓縮感知領域的課題。在這一領域，當大部分人都在想辦法利用信號的稀疏性去解決問題時，喜歡“唱反調”的張智林卻反其道而行之，將發力點放在解決非稀疏信號的壓縮感知問題。在連導師都質疑情況下，他成功解決了難題。因為這個觀點而發表的兩篇期刊論文在一年後均得到了該期刊的最高引用率獎。

敢於挑戰、樂於創新，一直都是張智林的特質。

在中學時代，他就創辦了當時全省最大的青少年天文協會，發表了多篇天文科普文章，舉辦過市裡的天文照片展覽；他還喜歡收藏古代錢幣，舉辦過個人古代錢幣展覽。“天文、地理、生物、歷史、物理、化學、任何一樣活動都在玩兒。”用張智林自己的話說，他的涉獵十分廣泛，交叉學科的知識促進他形成了自己的創新思維。

張智林認為，創新就像“上山採果子”：如果跟著大部隊走，是採不到很多果子的，只有走很少人走的路，才能採到又大又好的果子。喜歡“唱反調”也成為他對創新精神的註腳之一。

博士畢業後，張智林進入業界工作，逐漸將自己的研究中心轉向了數據科學的算法領域，從算法創新的角度切入產業問題，尋找創造性的解決方法。

▍用創新算法實現財富自由

離開校園後，張智林開始在三星北美研究院工作。工作的內容主要是信號處理和機器學習，比如智能手錶的心跳信號檢測、智能家居中電器耗電檢測和故障檢測。

為了將工作積蓄進行投資理財，2014年開始，張智林利用業餘時間編寫人工智能交易系統來進行股票交易。他用自己掌握的信號處理和機器學習技術從零開始編寫量化交易的算法，完全靠算法實現自動化的股票交易。

（圖片說明：一種常見的基於AI的股票模型預測算法邏輯。人工智能算法如今已經被廣泛運用到金融市場中。圖片來源：IKonwFirst）

“看到股價起起伏伏，我非常自然地就想到用信號處理和機器學習技術來做一個人工智能的交易系統。”說到這裡，張智林對數據科學的熱忱溢於言表：“股票市場中的數據很複雜，非常有挑戰性，這激發了我的興趣。一直以來我都是一個非常喜歡挑戰的人，別人越做不出來的東西我越感興趣。”

雖然大多數人認為股票市場很難預測，但在張智林看來，股價可以看做是受到宏觀經濟形勢、產業發展前景、公司經營狀況等多種因素干擾的信號，可以用自己掌握的信號處理技術來分析。喜歡“唱反調”的張智林迎難而上，利用業餘時間研究出許多創新的算法。

非金融專業的出身，幫助他規避了很多先入為主的思想，因此張智林能夠完全從複雜的數據集的角度去分析股票市場，利用機器學習、信號處理的知識去解決問題。

他用累計上千小時的業餘時間，最終造就了一個基於人工智能的股票交易系統。這套系統從2015年開始，達到超過100%的年回報率。張智林用自己的積蓄作為本金在股市投資，三年後實現了財富自由。2017年初他從三星北美研究院辭職，成立了做量化基金的公司 Data Legend Capital Management。

▍“彎道超車”的關鍵

2017年4月，張智林接受了AT&T公司的邀請，加入了這家全美最大的移動運營和互聯網服務商，幫助其發掘數據的巨大價值。

在AT&T，他主要負責電影、電視的廣告方面業務。在今年六月AT&T收購了時代華納後，每當時代華納推出新片後，張智林的團隊根據數據庫建立機器學習的模型，來預測哪些用戶最有可能觀看這些電影，再將電影上映的消息推送給他們用戶。

以電影《正義聯盟》為例。作為一部超級英雄類電影，這一題材在過去20年的美國市場上非常流行，積累了大量人氣。在做電影推廣前，張智林會在AT&T的用戶數據庫中，用機器學習算法尋找喜歡超級英雄題材的用戶，結合他們觀看電視和其他電子設備（例如手機）的習慣，決定推送電影廣告的時間和方式。最後還可以根據其他數據來判斷目標用戶有沒有去電影院觀看電影，以此來評估廣告效果，繼而優化推廣效果，不斷提升推薦算法的效果。

（圖片說明：《正義聯盟》海報，這部由時代華納推出的超級英雄電影就利用了AI推薦算法進行前期推廣宣傳；圖片來源：IMDb）

在美國，電影的推廣費用佔據總成本的比例很大。基於人工智能的推薦算法能讓廣告實現更精準的投放，把電影廣告推送給感興趣的用戶，從而大大提高廣告效果，降低廣告成本。

得益於這類技術，AT&T可以降低很多資訊內容的價格，給用戶帶來了更多利益。談到AT&T未來的發展目標，張智林信心滿滿地說，希望藉助數據科學讓AT&T能在廣告市場的佔有率提升到很大的份額，能夠與臉書、谷歌、亞馬遜等公司抗衡。長期以來，美國線上廣告業務60%以上的市場份額被臉書、谷歌、亞馬遜等巨頭佔有，而AT&T的排名目前靠後。

為了實現“彎道超車”，張智林希望在如何挖掘用戶的行為和喜好上做更多的算法創新。相比於其他廣告巨頭，AT&T也有自己的優勢——數據源豐富。因為AT&T提供了眾多服務，比如電信網絡，電視，智能家居等，因而具有多種多樣的用戶數據。這些數據的多樣化和獨特性，為算法創新提供了巨大的空間。

做廣告要了解用戶，通過其歷史數據分析出消費習慣、行為模式。谷歌的搜索數據需要結合用戶登錄Gmail的信息才能作為用戶的歷史數據，而大多數用戶並不會登錄郵箱再搜索，數據沒辦法跟特定用戶聯繫起來，歷史數據只能靠用戶電腦中的cookie，但現在政府限制了對cookie數據的使用。至於臉書，雖然擁有用戶的文本、圖片、視頻信息，可以通過挖掘這些數據來分析用戶喜好傾向和行為模式，但是仍舊有侷限性。

相比前兩者，AT&T的數據來源則非常多，比如來自手機，網絡，和電視的使用數據等。這三類數據基本覆蓋了用戶一天24小時的生活。在法律允許的範圍內，可以通過這些數據更好地分析出用戶的一些行為習慣，消費習慣等信息，從而投放更精準的資訊內容、廣告。

通過從零開始編寫算法，而不是單純採用現有的算法和工具包，張智林的團隊找到了很多巧妙的研究用戶行為的方法。他認為，人工智能算法上的創新，要抓住數據的特殊性去開發針對性的算法，才能得到最好的效果。而從算法層面的創新，是AT&T實現彎道超車的關鍵。

▍基礎的算法創新，勢在必行

在人工智能和數據科學的熱潮下，市場上出現的“數據科學家”越來越多。而且，在機器學習等領域已經開發出了很多商用的、免費的工具包，比如谷歌的Tensorflow、Python的各種庫等，“調包”越來越容易。這讓成為“數據科學家”的門檻彷彿也在降低。

但張智林不這麼看。他覺得：如果沒有親自推導過這些算法，只是知道怎麼用，是非常危險的。“以前數據量小的時候很多結果可以驗證，現在很多大數據得出的結論很難去驗證。如果做不到對算法的深刻理解，根本意識不到結論出的問題，甚至意識不到用了錯誤的算法。”

張智林認為，要成為真正優秀的數據科學家，首先要對算法有非常深刻的理解，能夠推導出它的數學公式，並能夠親自動手編寫主流的、重要的算法代碼，結合真實數據做做實驗，瞭解算法的性能。

在他看來，現階段的人工智能，也有被過分鼓吹的跡象，比如深度學習技術。

（圖片說明：Gartner公佈的2017年全球新興技術成熟度曲線，其中機器學習、深度學習等正處於泡沫的膨脹期；圖片來源：Gartner）

“其實深度學習技術有很多侷限性。深度學習技術在‘噪聲’非常小的時候發揮得很好，因而在許多圖像、視頻、語音的處理中很有優勢。但深度學習在‘噪聲’非常大的時候效果就不好了。並且，如果在實際問題中出現樣本訓練時沒有出現過的噪聲類型和干擾，就會出現很多問題。而在很多報道中都把這些侷限性或多或少地忽視了，因此我認為深度學習在未來會遭遇瓶頸，大家對它的熱度會適當降下來，過段時期又會再繼續發展起來。”

現在的AI，有點像2000年左右的互聯網。張智林表示，未來中國的數據科學家需要多設計出一些更加基礎的且有影響力的算法，在人工智能這個龐大的新興產業，只有做出更多根本上的創新，才能讓中國的發展不受制於別國。

“在人工智能領域，我們太喜歡去做應用層面的創新，但是在算法上的創新非常少。人工智能領域裡很多關鍵性的、可以開闢一個分支的算法幾乎沒有是華人做出來的。”張智林有些惋惜地說道。算法創新不僅是他自己的追求方向，也是他對中國人工智能未來的期許。

在他的博客中，有一句話恰如其分地映襯著他不斷創新的勇氣：Man cannot discover new oceans unless he has the courage to lose sight of the shore，意思是“勇士敢於離開海岸，才能發現新大陸”。

▍數據俠門派

張智林，美國加州大學聖迭戈分校電子與計算機工程系博士，曾在三星北美研究院擔任高級工程師，現為AT&T首席數據科學家。2013年至2015年在三星北美研究院工作期間，多次獲得三星成就獎和論文獎，具有在信號處理、機器學習、數據科學、計量金融等領域有十年多的研究和從業經驗。在 IEEE 會刊和頂級學術會議等發表機器學習、信號處理、數據分析相關高質量論文50餘篇，論文引用突破2400多次，其中四篇論文獲得IEEE期刊最高引用率獎。