數據科學平臺,Cool!但並不孤獨


一提到“數據科學家”,都覺得這是一項很酷的職業;而一說到“數據科學”,雖然僅僅一字之差,卻讓人心生敬畏,感覺有些晦澀甚至是距離感。但是,偏偏有這樣一家中國的數據科學平臺提供商成了Gartner發佈的“Cool Vendors in AI for Fintech in Asia/Pacific”報告中備受推崇的一家“酷公司”,而且是中國大陸地區唯一入選的企業,它就是九章雲極。


九章雲極身上的“酷元素”


生活中,我們形容一個人酷,可能是因為他標新立異的穿著打扮、特立獨行的做事風格,又或是冷冷的帶一絲傲嬌的氣質。九章雲極的“酷”究竟表現在哪裡呢?

九章雲極這個名字本身就透露著一股文藝範兒,極富中國韻味,再細細品味,九章就是九章算法,雲極便是雲計算與極=,獨特的專業韻味此為一酷。九章雲極DataCanvas數據科學平臺產品的吉祥物是一隻可愛的花栗鼠,叫做“八斗”,有才高八斗之意,這聽起來也挺酷。九章雲極為不同的客戶人群提供各種智能化的業務場景,比如信貸資格的審查、預測事故風險、人群分佈預警等,諸如此類的智能化應用是不是也挺酷?

數據科學平臺,Cool!但並不孤獨


數據科學平臺是一條逐漸升溫的新賽道。以前,人們對數據科學平臺的概念認知不清,想酷也酷不起來。2017年,Gartner給出了數據科學平臺的明確定義, 提出了數據科學平臺不可或缺的四大要素:“數據、算法、數據科學家、業務價值”。


九章雲極聯合創始人兼CEO方磊

“相比以往,企業客戶對數據科學平臺的理解確實更加深入。面向具體的業務場景,在數據的基礎上加載算法,解決企業的實際業務問題,這才是數據科學平臺的真正價值所在。”九章雲極聯合創始人兼CEO方磊指出,“專注於數據科學平臺這條賽道,我們引領未來的發展方向。DataCanvas數據科學平臺形成了獨有的“四庫”方法論,深入而靈活地應用機器學習、深度學習算法,為各行各業的客戶帶來新的價值。這可能是Gartner最看重的我們身上的‘酷’元素吧。”


從簡化應用到提升價值


“用數據解決業務問題,都屬於數據科學的範疇。”方磊一語中的。

很多時候,我們容易將數據科學與BI(商業智能)混淆。其實,BI的主要工作是數據的歸類和展示,不涉及算法,旨在讓人幫助人更好地理解業務,並間接地解決業務問題。數據科學的不同之處在於,它以算法為核心,直接解決業務問題。舉個例子,在處理車險理賠時通常需要上傳一些相關照片,然而有人會別有用心地上傳PS後的照片。面對這種情況,BI只是彙總最後的統計數據,告訴你歷史上出現過多少次這種造假行為,而數據科學平臺則在照片上傳時,通過算法和分析,直接指出哪些照片是PS過的。“BI最終還是要依賴人進行分析,而數據科學平臺通過在數據上加載算法,在具體的業務場景中實現閉環,並以自動化的方式解決業務問題。”方磊解釋說。


DataCanvas數據科學平臺

大數據、人工智能等應用剛興起時,因為業務場景、技術實現上的複雜性,所以無論是廠商還是企業用戶,都將降低應用門檻作為突破口。這是數據科學平臺從0到1的演進過程,這項工作九章雲極做了四五年,並掙得了第一桶金。在應用壁壘降低到一定程度後,積累了大量專業技術人員,以前可能只有數據科學家能完成的工作,現在具備一定技術能力的人也可以完成,生態發展被提上了議事日程,數據科學平臺的發展也過渡到從1到100的躍升階段。在這個階段,就要針對具體的業務場景,依靠算法,提升解決業務問題的能力,創造新的價值。正是在這樣的背景下,2019年初,九章雲極創新性地提出了DataCanvas“四庫”——模型倉庫、特徵倉庫、模版倉庫和AutoML Recipe倉庫的技術組合,可以有效解決行業AI建設的三大難題,包括經驗及業務知識融合、模型資產共享和臺運維管理,以及場景化知識遷移。

“四庫”是九章雲極歸納出的一套方法論,它將行業經驗、業務知識和數據科學技術有效結合,直接降低客戶對資源的依賴和AI建設的成本。方磊表示,數據科學平臺落地的一個核心是場景模板化,這樣才能在客戶中快速複製和交換共享。如果能把九章雲極的“四庫”方法論變成行業標準,無疑將加速這一進程。基於“四庫”,DataCanvas未來還會有重大的版本升級。

數據科學平臺,Cool!但並不孤獨


“在不同的發展階段,需要解決的主要矛盾也不同。從0到1的階段,要實現簡化,而在從1到100的階段,產生價值才是最重要的,這就要求模型更準。為此,必須將業務的Know-How加入進來。”方磊以小微企業信貸分析為例,其模型非常複雜,但仍有大量信貸知識不在模型中,比如隱形負債因素等,而這些知識和業務Know-How很多就來自人的經驗和積累,只有將它們融入模型,才能讓模型更準確,從而更好地挖掘業務價值。


通向AI的主流路徑


按照傳統的廠商分類方法,九章雲極會被歸到大數據廠商陣營。但是最近兩年,人工智能成了九章雲極的一個新標籤。比如,Gartner的“Cool Vendors in AI for Fintech in Asia/Pacific”報告,主要研究的對象是亞太地區將AI增強創新成功商用在金融科技領域的新興企業,九章雲極之所以能夠入圍,就是因為它在金融領域AI應用方面具有很強的創新能力。再比如,在IDC發佈的《IDC MarketScape:中國機器學習開發平臺廠商評估》研究報告中,九章雲極也位於主要廠商位置。

“AI的定義十分寬泛,機器學習、深度學習都屬於AI的範疇。但是AI也分成多個學派,比如其中的符號學派,不借助數據,僅憑符號就能推導出結果。”在方磊看來,AI是一種狀態、一個目標,而數據科學是達到這一目標的主流方式和路徑。


與很多AI應用類廠商不同,九章雲極是一個平臺廠商。從2014年開始推出產品,經歷了公有云、私有云等不同的交付方式,九章雲極在AI應用方面的差異化定位更加清晰。通常來說,數據處理要經過四個主要環節,先建立數據倉庫,然後進行數據治理,接下來實現商業智能,最後是藉助訓練出的模型,自動化地解決業務問題。相關廠商也按照這四個部分進行分類、匯聚。九章雲極就處於整個數據價值鏈條的最後端,也是實現價值的關鍵。

數據科學平臺,Cool!但並不孤獨


Gartner從2017年起才將數據科學平臺作為專門的研究領域,在此之前,九章雲極執著地走過了一段孤獨的路程。但是,方磊並不認為數據科學平臺是一條孤獨的賽道。在國外,數據科學早就形成了一個成熟的生態,廠商間的併購不斷,估值70億美元的數據科學平臺企業讓人豔羨。

與國外相比,中國在數據科學領域還有較大差距,主要體現在:美國現有兩三百萬名數據科學家,很多公司都有專門的數據科學團隊,有的還設立了CDO(首席數據官)的職位,但是中國的數據科學家稀缺,人才成了瓶頸;美國的客戶具備較強的技術能力,傾向於在標準化的軟件產品之上自己進行集成和開發,而中國客戶更喜歡端到端的解決方案和服務,有時還需要廠商提供具體的模型,這是生態和應用不成熟的一種表現。

為了滿足中國客戶的需求,九章雲極一方面為大型企業客戶提供平臺化的產品;另一方面除了為中小企業客戶提供整體解決方案以外,還提供具體的模型。“我們上不碰企業的業務,下不碰企業的數據,而是專注於提供數據科學平臺和模型。”方磊表示,“數據科學平臺的重心在算法上,而不是簡單地提供數據統計和彙總功能。從數據到業務,數據科學平臺是中間的橋樑,將逐步深入到各個場景中。”

企業客戶從自己需求的角度看數據科學平臺,會有不同的理解。比如,從業務的角度,有人認為數據科學平臺就是一個模型工廠;從管理的角度,有人將數據科學平臺當成管理數據科學家的OA,可以更好地將數據科學家組織起來,發揮其價值。不管如何描述數據科學平臺,各行業已經達成了一個基本共識:藉助數據科學平臺,可以找到業務的價值點。


從“酷”到主流


在數據科學平臺的賽道上,九章雲極是不是要跑得再快一些?方磊認為:“to B類型的企業還是要依靠積累效應。2019年,我們完成了新一輪融資,並且連續保持年增長100%。未來,我們仍將按照自己的節奏發展。”

不僅數據科學家這一職業酷,數據科學這項事業更酷,他們都是為了智能世界的明天更加美好。但在方磊看來,什麼時候人們不再談論數據科學、數據科學家酷不酷這個話題,就說明數據科學已經成了主流,被各行各業的用戶所接納,以九章雲極為代表的數據科學平臺廠商的好日子才算是真正到來。

8#x�����


分享到:


相關文章: