DT數據俠專訪崔曉波丨數據“獨角獸”是怎樣煉成的?

崔曉波簡介

DT數據俠專訪崔曉波丨數據“獨角獸”是怎樣煉成的?

崔曉波畢業於南開大學,曾先後擔任BEA亞太區電信技術中心總監和Oracle大中國區A&C技術總監。2011年,創立了TalkingData,將“數據改變企業決策,數據改善人類生活”作為公司願景,踐行“一切用數據說話”的原則,通過數據幫助客戶實現一切可實現的價值,成為客戶信賴的長期合作伙伴。

2010年,崔曉波和幾個朋友來到地壇公園,一邊曬太陽,一邊討論“創業”的事兒。

在這次創業之前,他身份很多元:包括黑客、程序員、連續創業者、國企處長、技術總監等等;在此之後 ,崔曉波用了七年的時間探索數據科學的商業道路,併成功打造了一個基於移動大數據分析的“獨角獸”公司。

代號為“CXB”的“病毒少年”

與很多數據科學家的起點一樣,崔曉波的數據之路也是從學生時代的計算機生涯開始的。

1993年,崔曉波考入了南開大學信管專業。中國九十年代的計算機大多還處於英特爾286、386的芯片時代,操作系統還是原始的OS2、DOS等,漏洞和Bug很多。當時與操作系統最直接相關的就是病毒了。很多學生為了完善操作系統的缺陷,開始研究病毒,進行一些“病毒攻防戰”,比如第一代大麻病毒、小球病毒、變性病毒等。

國內第一代的程序員們,大多都是從“病毒”做起,崔曉波也是其中之一。

DT數據俠專訪崔曉波丨數據“獨角獸”是怎樣煉成的?

(圖片說明:崔曉波在北京辦公室接受DT君專訪)

崔曉波回憶說,當時在他們系裡,一個計算機學生的最高榮譽,就是能夠被選中去“管理機房”。當時機房的管理團隊都是學校最一流的計算機高手,他們為了保護機房的電腦,設置了很多高級的加密算法,讓普通學生無法實現修改、刪除計算機文件等。

然而過了一段時間,機房的管理人員發現有人繞過了他們的保護,在系統裡留下了一段“CXB”的字符,頗有“到此一遊”的意思,這說明有人破解了機房的加密算法。“於是他們就不斷提高自己的加密算法難度,我就不斷接著去破解,這種攻防戰是最費腦筋的,但是也最有意思”。崔曉波回憶起當年的“病毒”攻防生涯,依然津津樂道。

在大學裡研究“病毒”的時候,崔曉波逐漸結識了王江民、求伯君、吳曉軍等中國最早的一批著名程序員們。其中,王江民的江民公司曾經發布了KV系列等中國最早的殺毒軟件,是中國計算機軟件領域的先行者。

一個有意思的小插曲是,早在90年代,崔曉波曾經就使用了一個數據科學的模型方法,破解了一款當時號稱“無法破解”的殺毒軟件:江民KV3000。只不過當時,他還沒有意識到自己使用的就是數據科學的方法。

“KV3000中設置了大量的反跟蹤陷阱,的確非常複雜,很難破譯。”崔曉波回憶說,當時KV3000出來後,四個月都沒有出現盜版,足以說明其複雜性。後來,崔曉波使用了一個模型的方法,恰好可以繞開那些邏輯陷阱,成功地進行了破解。

“我每破解完一個軟件,就會取一個名字。我當時把破解了的KV3000取名為KK13,幾天之後我去逛街,發現有人說KV3000被破解了!我很興奮,趕緊買了一個回來,結果看到名字是KK13。特別搞笑。”崔曉波笑著說。

由於在計算機系統上出色的表現,崔曉波剛畢業就被吳曉軍(DT君注:曉軍電腦創始人,其發明的2.13漢卡是中國最早的漢字系統之一。)挖到了一家國企任職。

為了“務實”而來,為了“理想”離開

九十年代末是中國第一波互聯網浪潮興起的原點。騰訊、阿里、新浪、網易等這些後來的互聯網大佬多是從98、99年開始起家,打造自己的互聯網商業帝國。

而在太平洋的另一岸,美國的互聯網也在經歷著歷史上最明媚的春天。這也吸引了很多優秀的中國程序員前去學習深造,尋找機會。

畢業了的崔曉波當時並沒有考慮太多這些所謂的大趨勢,來自新疆的他想法很實在——得先能在北京站住腳。“所以我就問了吳曉軍兩個問題:能解決北京戶口麼?能解決住房麼?吳曉軍說可以,我就來到了這家國企。當時真的沒有考慮太多,直到進來才發現,這是一個賣農藥和化肥的農產品公司,和數據、互聯網幾乎沒什麼關係。”

在那家公司裡,崔曉波更多是被看成一個“修電腦的”,而不是什麼互聯網人才,這讓一直很要強的他產生了一種強烈“要做事”的衝動。

“我當時看到了電子商務的可能性,於是就給領導寫了一個關於創辦農資交易網可行性報告。”雖然沒太明白他要做什麼,但是領導還是對崔曉波的想法提出了精神上的鼓勵,以及物質上的“不支持”——只可以用公司的名頭。於是,崔曉波就只能開始全部自己來。他為了創辦農資交易網站,寫了人生第一份BP(商業計劃書),然後找融資、談擔保、拉貨源等等。“最後還真在網站上賣出了一噸化肥!”崔曉波興奮地回憶說。

後來他還牽頭做了中國彩票網、中國企業網、棉花的交易系統等項目,是地地道道的連續創業者。這些項目大多取得了不錯的效果——二十多歲的他那時已經成為系統內最年輕的處長,處理過上千萬的投資交易,管理過幾家不同類型的公司,從某種角度來說,他已經取得了世俗意義上的成功。

但這時他心中“理想主義”火苗卻又在跳動了,最終,崔曉波還是選擇了離開。國企體制化的環境與互聯網“野蠻生長”的基因有著天然的衝突——“我覺得我不能一輩子呆在國企。”

崔曉波的離職當時還引起了一陣審計風波,因為大家不相信會有人放棄這麼好的工作環境和待遇,去做其他的事情。他回憶當初的情景時說到:“領導當時還打趣說:‘小崔你是不是經濟上有問題,你要老實交代啊’。”其實他當時只是覺得互聯網和數據能做更多的事情,而自己不該侷限於此。

離開國企後,崔曉波自降2/3的薪水,來到BEA System軟件公司從頭開始,一路從底層的合同工做起,到正式員工、管理崗,最後做到總監。BEA在2008年被Oracle收購,崔曉波也順理成章地進入了Oracle。

這段外企的工作經歷讓崔曉波對現代的經營企業有了更多的認識。用崔曉波的話說,BEA教會了他如何運營一個創業團隊,在Oracle則領悟到了如何把業務做大的秘訣。

一轉眼到了2010年,已經在IT屆摸爬滾打多年的他,再次逐漸開始思考創業的可能性。

理想主義的選擇

那時的崔曉波已經35歲了,是Oracle大中華區A&C部門技術總監,在外企過著光鮮平穩的金領生活。不過,這份平靜很快就被一塊叫做“數據”的石子打破,並在以後的時間裡不斷地在他的生命中泛起波瀾。

關於這次脫產創業,崔曉波一開始並沒有想太多。他從自己過往的經歷中,覺得看到了一個未來可能的新趨勢——數據,於是認為自己應該去做這件事兒。

他們在創業初期討論的話題非常理想主義,甚至“不接地氣”。不談市場、不聊客戶、不提需求等一切商業的基本元素,崔曉波每天就只思考一個問題:做數據到最後,究竟是在做什麼?

這有點像創業者版本的“人生三問”(雖然簡化成了一個問題):我是誰?我從哪裡來?我要到哪裡去?——在崔曉波創業初期, 這種終極的創業哲學問題是最讓崔曉波最操心的事情。某種程度上,這源自於崔曉波自己性格中對於理想主義的偏好。

在崔曉波職業生涯的幾次選擇中,每當現實與內心想法產生衝突的時候,他總會選擇“唯心”一把。從開始做數據到現在,他會經常說到一種“數據信仰”,幾乎把這種唯心式偏好發揮到了極致。

不過,如果你把自己還原到2010年的場景中,你會自然地感覺這種天馬行空討論,並不會有什麼結果。彼時,“數據科學”在國內還不是一種顯學,沒有多少人留意它;互聯網世界還集中在Web端的流量爭搶中,3Q大戰激戰正酣;Nokia的功能機依然在手機市場上獨霸天下,佔據著中國市場將近50%的市場份額。

但是程序員出身的崔曉波,讓他在當時對數據行業做了兩個非常“務實”的判斷:第一,手機將不再只限於通話;第二,數據將在移動互聯網端產生爆發。

數據“獨角獸”

“2008年的時候,我曾經有一次加入騰訊的機會。Pony(馬化騰)當時跟我說了一句話,我印象非常深,雖然那個時候騰訊還沒有如今這麼大的規模,但他堅信:騰訊未來將改變人們的通信方式。”

崔曉波深以為然。雖然聽起來有點俗套,但他認為偉大的企業普遍都有一個宏遠的願景。他從“數據分析”這個核心商業點出發,最後為公司定下了兩個願景:數據改變企業決策,數據改善人類生活。他認為未來企業的決策方式一定會從“經驗性地拍腦袋”,轉變為“科學地看數據”,而且未來人類的生活,都將會因為數據而發生深刻的改變。

不過理想很豐滿,現實卻很骨感。在創業的幾年中,為了應對不斷變化的市場環境,崔曉波也帶領著公司幾度改變業務方向。

覆蓋手機端的移動互聯網大數據分析是崔曉波的起點。從最開始的數據分析工具、到後來企業級的定製化數據服務,再到聚焦於幾個垂直行業,做數據產品(數據集、數據模型和數據應用)。如今,TalkingData的月活躍用戶已經突破了7億,服務超過12萬款移動應用以及10萬多應用開發者,如今已經成為國內領先的獨立第三方數據智能服務商。

“剛開始有些客戶不相信,但是他們觀察了兩年後,發現我們真是這樣,只專注於數據這一件事兒,不參與其他推廣活動。有些客戶的業務,也真的因為引入了數據分析而實現了快速增長,例如遊戲、金融等行業。”

後來,當業務高速發展的時候,他們也走過一些彎路,比如佈局DSP廣告。“我們花了很大的精力和財力投入到DSP(Demand-Side Platform,需求方平臺)廣告的業務上,希望幫助廣告主優化廣告效果,但是忙活了很久都沒有什麼效果。”崔曉波最後認識到,這是因為國內的廣告流量數據被汙染得非常嚴重,以至於無法進行有效分析預測。平臺主並不希望讓自己的流量公開透明,從而影響財路,這使得整個行業的保護主義盛行。這也讓崔曉波意識到第三方平臺的侷限性——如果平臺的數據不真實,那麼流量分析就是沒有價值的。

創業初期,崔曉波的公司基本模仿了BEA時期的創業模式,非常高效;後來隨著規模的擴大,他逐漸將在Oracle時期學到的渠道管理方法,移植了進來,通過打造數據生態的方式,拓展自己的數據源,優化產品和服務。

到2017年底,在各大媒體評的報告中,他的公司以超過10億美元的估值成長為國內數據分析領域領先的“獨角獸”企業。

以人為本的數據科學

2016年AlphaGo與李世石的圍棋大戰,可以稱得上是數據科學世界的里程碑事件。由於這次比賽後,AI(人工智能)話題開始發生井噴式的增長,正式引發了2017年全球的AI產業熱潮。

作為業餘圍棋五段選手,崔曉波和聶衛平老先生一起解說了李世石與AlphaGo當年的第三場比賽。“看完第三場後的第一感受就是絕望”,崔曉波說,“人類最好的棋手,在AI面前一點機會都沒有,AI一步都不會下錯。”

DT數據俠專訪崔曉波丨數據“獨角獸”是怎樣煉成的?

崔曉波認為,AlphaGo當時所展示出的AI技能主要在三個方面:價值網絡、策略網絡和蒙特卡洛搜索樹搜索,其中蒙特卡洛樹搜索是這次AI浪潮的核心。但是經歷了一年多的發展,AI在其他行業的應用,並沒有向人展示出類似在圍棋領域足夠的震撼。崔曉波說;“AI的本質只有一個,就是幫人做決定,但是除了在特定的諸如圍棋等領域,AI還不能夠達到比人更好的決策水平。”

所以,與其研究AI如何幫人做決定,崔曉波認為當下更實際的是,不如利用數據科學研究“人”本身究竟是如何做決定的。他受到MIT的人類動力實驗室的啟發,在公司成立了一個“人本實驗室”,把數據科學與社會學、心理學等人文科學結合起來,研究人心裡的內在動機和社會行為。

“目前,大部分商業數據公司主要是通過數據,觀察人的活動行為,進而判斷人的特點,作出相應的商業決策,並不關心人心理做決策的真正原因和動機。”崔曉波認為,人本實驗室就是為了彌補這一點,讓數據科學更加“以人為本”。“在數據時代,人的心智也在發生急劇的變化,這是我們做這個實驗室的初衷”,崔曉波說到。

2017年底,崔曉波的人本實驗室團隊,用機器學習等數據科學的方法,重新對北京城市的人群做了一次分類。由於工業化和城市化的影響,傳統的城市人群會根據階層劃分,在城市中形成多箇中心化的網絡佈局,例如北京的金融街、CBD、某某學區等,這直接影響了城市規劃和資源分配方式。

當崔曉波用時空大數據重新觀察北京的人群時,他發現了一種基於時空摺疊的新的分類方法。由於人們的作息時間、生活方式不同,有些傳統意義上應該是某一階層的人群,其實在生活中完全沒有交集——他們都在國貿出現,但是永遠碰不到——這就會讓一個城市缺乏活力,影響資源的分配效益。數據科學給出了七種人群劃分,然後,他們再用社會科學的方法去解讀、驗證它。

只有瞭解數據,又瞭解人的行為模式和動機,才能夠進行更好的用數據改善人類生活。這可能是未來數據科學,離我們普通人最近的樣子。

在採訪的最後,崔曉波總結自己,是一個數據科學領域裡“務實的理想主義者”。這聽起來有點矛盾,不過,縱觀他的職業生涯,他對人對事總是“很實在”,對自己對未來卻又充滿“理想”。在虛實之間,他似乎總能找到一種奇妙的平衡狀態,踐行著自己的數據科學之道。

注:


分享到:


相關文章: