03.04 ​AI企業做的不是軟件,是服務


​AI企業做的不是軟件,是服務


原文來自A16Z,作者Martin Casado、Matt Bornstein

原文鏈接:https://a16z.com/2020/02/16/the-new-business-of-ai-and-how-its-different-from-traditional-software/

理論上來說,人工智能(下稱AI)會是軟件的未來。在一系列曾經無解的計算機問題上,AI成為了關鍵。軟件開發人員的工作內容發生了根本性的變化,既有源代碼,也有數據

許多AI公司和投資者都相信這種趨勢會從技術領域輻射出去,AI業務會逐漸類似於傳統的軟件公司業務。但根據與AI公司合作的經驗,我們並不敢苟同。

我們相信AI有能力徹底變革商業模式,而且已經並將繼續投資應用型AI公司和基礎設施。然而在許多情況下,AI公司並沒有軟件企業的架構,看起來更像是傳統服務公司,尤其是考慮到以下幾個方面:

1.由於需要大量雲基礎設施和人力支持,毛利率較低

2.棘手的邊緣用例阻礙

規模化

3.由於AI模型的商品化和數據網絡效應,護城河防禦愈發薄弱

有趣的是,各AI公司的財務數據出現了驚人的一致:毛利率通常在50-60%之間,遠低於軟件即服務(下稱SaaS)公司的60-80%。早期私人資本的投入可以暫時掩蓋這些劣勢,尤其是當投資者追求增量而非盈利的時候。但目前還沒有明確跡象表明,長期的產品或進入市場(下稱GTM)策略優化能夠完全解決這個問題。

SaaS開創了有別於本地端軟件的新模式,AI則在創造一種新業務類型。本文將介紹AI公司與傳統軟件公司的不同之處,並分享如何化解這些差異的建議,目的不是給出直觀的解決方案,而是幫助運營商和其他人瞭解AI的潛力和戰略前景。

軟件+服務=AI?

軟件(包括SaaS)的美妙之處在於可以一次生產,多次銷售。這種方式帶來了引人矚目的效益,包括穩定的經常性收入、高毛利率,以及相對罕見的超線性增長。軟件公司有潛力建立強大的護城河,他們的知識產權通常是代碼。

傳統服務業正好相反,每個新項目都需要專門人員,並且只能銷售一次。因此,收入往往不穩定,毛利率較低,規模化最多也只是線性的。防禦則更具挑戰,通常依靠品牌或現有賬戶控制,因為任何非客戶所有的知識產權都不太可能具有廣泛的適用性。

AI公司越來越多地將軟件和服務的元素結合起來。

不管是從外觀還是使用體驗來看,大多數AI App都更像普通的軟件:依賴常規代碼執行用戶接口、數據管理和其他系統集成等任務,其核心在於經過訓練的數據模型讀取圖像、轉錄語音、生成自然語言和執行其他複雜任務。維護有時也像是一種服務,除了傳統的客戶支持和客戶成功功能,還需要大量針對客戶的工作和成本投入

這從方方面面影響了AI業務。我們將從幾個方面探討:毛利率、規模化和防禦能力。

毛利率:雲基礎設施成本高昂,還難以估量

過去的本地端軟件時代,交付意味著產品售出,概不負責。無論是在服務器還是臺式機上運行軟件的成本都由買方承擔。如今,隨著SaaS的強勢崛起,這一成本被推回給了供應商。大多數軟件公司每個月都要給雲服務平臺AWS和Azure支付鉅額賬單。對軟件的要求越高,費用就越高。

AI的要求,是真的高:

1.訓練一個AI模型的計算資源可能就要數十萬美元。雖然聽起來單次投入就夠了,但實際上需要不斷地再訓練,為AI模型提供的數據也會隨著時間而變化,也叫“數據漂移”。

2.從計算角度來看,模型推理(預測的過程)也比操作傳統軟件更復雜。執行一系列矩陣乘法運算的計算量比讀取數據庫大得多。

3.與傳統軟件相比,AI更可能在圖像、音頻或視頻媒體應用。這些數據的存儲消耗、處理成本通常更高,而且經常會遇到感興趣區域的問題,即App需要處理一個大文件才能找到一個相關的小片段。

4.雲操作可能比傳統方法更復雜、成本更高,尤其是現在沒有工具可以在全球範圍內擴展AI模型。於是AI公司必須定期跨雲區域傳輸模型,以提高可靠性、減少延遲和確保合規,這也增加了大量的遷移成本。

綜合起來,AI公司在雲資源上的花費通常達到25%以上。在極端情況下,對於處理複雜任務的初創公司來說,人工處理數據比操作訓練模型要便宜。

專門的AI處理器及時出現,它們可以更有效地執行計算、優化技術,如模型壓縮和交叉編譯,從而減少所需的計算量。

AI專門處理器和優化技術可以緩解這些情況:處理器可以更有效地執行計算,而優化技術,如模型壓縮和交叉編譯,可以減少所需的計算量。

但目前效率曲線的形狀尚不明朗。為了獲得更高的精度,需要指數級地增加處理工序和數據。正如之前指出的那樣,模型複雜度與日俱增,處理器也不大可能跟上這一速度。摩爾定律不夠用,訓練最先進的AI模型所需的計算資源自2012年以來增長了30萬倍,而NVIDIA GPU的晶體管數量僅增長了約4倍!分佈式計算可能是個辦法,但它主要解決的是速度問題,而不是成本問題。

毛利率:App依賴“人在迴路”得以高精度運行

人在迴路系統有兩種形式,這兩種形式都會降低AI初創公司的毛利率。

1.訓練最先進的AI模型需要手工清理和標記大型數據集。這一過程費時費力,成本高昂,是阻礙AI廣泛應用的最大障礙之一。另外,並不是部署了模型之後訓練就可以結束。為了保持準確,需要不斷捕獲、標記新的訓練數據,並反饋到系統。

雖然像漂移檢測和主動學習這樣的技術可以減輕負擔,但非官方數據顯示,許多公司在這一過程中花費了高達10-15%的收入,這還不包括核心工程資源。數據還表明,開發工作遠遠不止傳統的錯誤修復和功能添加。

2.需要複雜認知推理的任務,人類經常被實時安排到AI系統中。例如,社交媒體公司僱傭了數千名審查員協助AI調節系統。許多自動駕駛系統也需要遠程操作員,大多數AI醫療設備會與醫生(作為聯合決策者)交互。

隨著人們越來越瞭解現代AI的能力,初創企業正逐步採用這種方法。銷售純軟件產品的AI公司也在引入服務功能,導致相關成本增加。

隨著AI模型性能的提高,對人工干預的需求可能會下降。不過,人類不太可能完全脫離迴路。許多問題,比如自動駕駛汽車,太過複雜,無法通過當前一代AI技術實現完全自動化。安全、公平和信任問題也需要人類的有效監督,這可能會進一步體現在美國、歐盟和其他國家及地區正在制定的AI法規中。

即使最終實現了某些任務的完全自動化,也不清楚利潤率會因此提高多少。AI App的基礎功能是處理輸入的數據並生成相關預測。

操作AI系統的成本與處理數據量直接相關。一些數據點由人類處理(相對昂貴),而另一些則由AI模型自動處理(希望成本更低)。但無論如何,每一次輸入都要得到處理。

基於這個原因,兩類成本,雲計算和人力支持,實際上是聯繫在一起的。減少一個往往會推動另一個的增加。等式可以兩邊同時優化,但不可能達到SaaS業務的零成本水平。

長尾效應下的AI系統規模化難度比預期大

比起傳統軟件,AI公司找到產品-市場匹配的難度更高。很容易就會產生錯覺,感覺自己達成了匹配,尤其是有了5-10個大客戶以後。機器學習(下稱ML)團隊的工作越積越多,客戶部署進程磕磕絆絆,重心不得不從提升銷量轉移。

罪魁禍首通常是邊緣用例。許多AI App部署開放式接口,處理繁雜的非結構化數據(如圖像或自然語言)。用戶則認為產品具有人類甚至超人的能力,這意味著邊緣用例隨處可見:現在研究的AI產品功能有多達40-50%是用戶需求催生的。

換句話說,用戶可以在AI App中輸入任何東西,他們也的確是這麼做的。

這項工作龐大且繁瑣。輸入範圍如此之大,每個新客戶都可能生成前所未見的數據。即使是看起來很相似,例如兩家正在進行缺陷檢測的汽車製造商,僅僅是因為在裝配線上放置攝像機的位置不同,就可能需要完全不同的數據。

一位AI公司創始人稱這種現象為AI產品的“時間成本”。每次她的公司與新客戶合作時,都會專門預留一段時間,進行數據收集和模型微調。瞭解客戶數據的分佈,她就能在部署之前排除極端情況的出現。

這當然需要付出代價:在模型精度達到可接受的水平之前,公司的人力和財務資源都會被佔用。訓練的持續時間通常也是未知的,很少有更快生成訓練數據的捷徑……

AI初創公司會花費比預期更多的時間和資源部署產品。預先確定這些需求很困難,因為傳統的產品原型設計工具(如模型、原型或beta測試)一般只覆蓋最常見的情況。與傳統軟件一樣,為最早的客戶群提供服務特別耗時,但與傳統軟件不同,這一過程可能會時有發生。

AI業務的防禦策略仍不明晰

偉大的軟件公司有強大的防禦護城河,如網絡效應、高轉換成本和規模經濟

AI公司也有利用這些因素的可能。防禦的核心是企業技術優越的產品。最先推出軟件的公司坐擁壓倒性的品牌優勢和先期壟斷的時機。

AI領域的技術差異化很難實現。新的模型基礎設施主要在開放環境中開發。參考實現(預先訓練的模型)可以從開源庫獲得,模型參數可以自動優化。

數據是AI系統的核心,但它通常歸用戶所有,存在於公共領域,或隨著時間的推移成為一種商品。隨著市場的成熟,數據的價值也在下降,網絡效應開始減弱。在某些情況下,我們甚至看到了與AI業務相關的規模不經濟。隨著模型變得成熟,正如《數據護城河的空洞承諾》一文中所說,處理每一個新的邊緣用例都變得越來越昂貴,只對越來越少的相關客戶有價值。

這並不意味著AI產品的防禦能力不如純軟件產品,但AI公司的護城河比許多人預期的要淺。從防禦的角度來看,AI在很大程度上可能只是通往基礎產品和數據的渠道

建立、擴張和保護優秀的AI公司

AI公司取得長期成功的關鍵是要直面挑戰,並將服務和軟件的優點結合。秉承這種精神,以下是創始人可以借鑑的措施,發展新的或現有的AI App。

1.儘可能地降低模型的複雜性。在為每個客戶訓練獨特模型的初創企業與讓所有客戶共享同一模型的初創企業之間,銷售成本存在巨大差異。“單一模型”更易維護,能夠更快地向新客戶推廣,且支持更簡單高效的組織。這種模式還可能緩解數據管道的膨脹、減少訓練操作的重複,有效減少雲基礎設施的成本。

關鍵是在交易之前,儘可能多地瞭解客戶及其數據

。有時,新客戶的需求明顯與現有的產品難以匹配,就需要重新開發。但大多數情況下,客戶帶來的變化更微妙,只涉及幾個獨立模型的微調。權衡長期經濟發展與短期增長是AI公司創始人面臨的最重要工作之一。

2.仔細、精確地選擇問題域,以減少數據複雜度。實現勞動自動化從根本上說是一件困難的事情。許多公司發現AI模型的最小可行任務比預期的範圍要窄。

例如,有些團隊通過電子郵件或工作公告提供簡短建議獲得了成功。客戶關係管理公司在更新記錄這一AI細分領域已經發現了巨大價值。有大量問題人類難以執行,對AI來說相對容易,包括大規模、低複雜度的任務,如調試、數據錄入/編碼、轉錄等。這些領域出現邊緣用例的可能性也比較小。也就是說,它們可以簡化推動AI發展進程的數據。

3.為可變成本做好準備。創始人應該對商業模式有可靠、直觀的心理預設。實際操作中的成本情況可能會比本文假設的要低,但是假設成本會完全消失(或者強行讓成本消失)沒有意義。相反,

建議在制定商業模式和GTM戰略時不要追求高毛利率,可以深入瞭解輸入模型的數據分佈情況。

將模型維護和人工容錯放在首位。跟蹤並測量實際可變成本,不要讓這部分支出被研發費用掩蓋。在融資過程中只做保守的收益假設,不要等待規模化或外部技術進步來解決問題。

4.擁抱服務。滿足市場需求可能意味著提供全套翻譯服務,而不是僅提供翻譯軟件;意味著管理出租車服務,而不是出售自動駕駛汽車。建立混合業務比推出單純的軟件更難,但這種方法可以深刻洞察客戶需求,並建立快速增長的公司。

服務也可以是啟動產品市場進入引擎的絕佳工具,特別是在銷售複雜和全新技術時。關鍵是堅持不懈地追求一種戰略,而不是同時考慮軟件客戶和服務客戶。

5.為技術堆棧的變化做好準備。現代AI還處於初級階段。幫助專業人員高效、標準完成工作的工具才剛剛出現。在接下來的幾年裡,希望看到它們的廣泛普及,實現模型訓練自動化、推理效率提高、開發人員工作流程標準化,以及能夠檢測和維護開發中的AI模型。

總體而言,雲計算的成本問題也越來越受關注。將AI App與當前的工作方式緊密耦合可能會導致未來的架構缺陷。

6.用傳統方法提高防禦能力。雖然目前還不清楚AI模型本身或其基礎數據能否成為長期的護城河,但好的產品和專有數據有能力支撐業務。AI為創始人提供解決老問題的新角度。

例如,AI技術僅僅通過更精準的檢測率,就讓沉悶許久的惡意軟件監測市場眼前一亮。結合傳統市場,建立具有粘性的產品和持久業務也不失為一個好方法。有趣的是,一些AI公司通過有效的雲策略鞏固了自己的市場地位,比如最近一代的開源公司。

總結

從傳統意義上講,現在的大多數AI系統不完全是軟件,因此AI企業看起來不像軟件企業。AI企業需要考慮人力支持和可變成本,也不像我們希望的那樣容易擴張。強大的防禦能力對“一次構建,多次銷售”模式至關重要,也不是唾手可得的。

這些特點使AI在某種程度上更像服務業。你可以更換服務公司,但不可能完全更換服務。

信不信由你,這不是壞事。可變成本、規模化環境和防禦護城河等最終將由市場決定,而不是單個公司。作為新事物的AI公司已經打入了新市場,創造了大量機會。有許多優秀的AI公司已經成功地走出迷宮,推出性能強勁的產品。

AI還處於從研究課題向生產技術過渡的早期階段。人們很容易忘記,為當前AI軟件開發浪潮開創先河的AlexNet發佈還不到八年。智能應用正在推動軟件行業向前發展,讓我們期待,它的下一站會是哪裡?

​AI企業做的不是軟件,是服務



分享到:


相關文章: