利潤低、擴展難、運營難:AI公司的創始人不容易啊

利潤低、擴展難、運營難:AI公司的創始人不容易啊

來源:獨訊頭條自媒體平臺:入駐獨訊頭條自媒體平臺,享受三億補貼

如今,對軟件開發者群體而言,數據的意義不亞於傳統源代碼。

目前,眾多 AI 企業(以及相關投資方)都在軟件開發層面押下重注,認為 AI 業務將在純技術之外,給軟件廠商帶來深遠影響。但是,究竟是什麼樣的影響,很多 AI 企業自己也說不太清楚。

為什麼 AI 公司很少極速擴張?

大多數情況下,AI 企業的經濟結構與傳統軟件行業存在巨大差異。有時候,AI 廠商的表現更像是傳統服務公司,其典型特徵包括:

  1. 由於需要大量使用雲基礎設施與人力支持,因此運營毛利率始終較低;
  2. 極端案例往往帶來大量棘手難題,導致 AI 解決方案的可擴展性遭遇挑戰;
  3. 隨著 AI 模型商品化以及數據網絡效應帶來的挑戰,維持市場優勢的能力一直偏弱。

雖然資本界對 AI 技術頗為看好,但 AI 企業的財務數據不是那麼令人滿意,這類企業的毛利率通常在 50% 到 60% 之間浮動,明顯低於 SaaS 業務的 60% 到 80%。

早期私人資本的注入雖然能在短時間內掩蓋這種收益低下的問題,但 再有激情、再願意用增長換盈利的投資方,也無法承受長期不賺錢的局勢。更可怕的是,目前並沒有出現能夠完全解決問題的長期產品設計或者上市優化策略。

正因如此,AI 公司很少像傳統企業那樣擴張,至於不太賺錢的原因,我們接下來將逐一探討。當然,我們的目標絕不是建立新的範式,而是幫助運營者以及對 AI 業務有興趣的朋友瞭解 AI 技術的經濟前景與戰略方向,希望能給大家的企業規劃帶來些許啟示。

軟件 + 服務 =AI?

軟件的好處是一次生產、隨意銷售,這為整個行業帶來了引人注目的業務收益,包括可觀的收入、極高的(60% 到 80%,甚至更高)毛利率,以及超越線性的擴展軌跡(相對罕見,但確實有不少廠商憑藉網絡效應或者規模效應完成飛躍式發展)。

軟件企業具有強大的優勢維持能力,憑藉豐富的知識產權儲備(通常體現為代碼),原本的優勢將得以長期存續。

相比之下,服務產業則走向完全相反的極端。服務業的每個新項目都需要指派專門的人員,且產品只銷售一次、無法複製。結果就是,這類廠商的收入往往是非線性的,毛利率較低(30% 至 50%),且規模擴展大多嚴格遵循線性軌跡。最後,優勢維持能力相對偏弱,廠商只能控制自身品牌或者現有客戶,但知識產權的缺失很難不斷吸金。

如今的 AI 企業,正越來越多將軟件業務與服務業務結合在一起。

大多數情況下,AI 應用程序在使用感受與直觀判斷上都類似於普通軟件,這類產品依靠常規代碼完成用戶交互、數據管理或者系統集成等任務。區別在於,AI 應用程序的核心是一組經過訓練的數據模型。這些模型能夠解釋圖像、轉錄語音、生成自然語言並執行其他複雜任務。對這類模型的維護有時更像服務行業——需要針對特定客戶投入大量成本,而且成本支出遠遠超過正常的支持性開銷。

這種動態特徵的存在,從各個角度影響著 AI 業務的面貌與開展方式。相較於傳統軟件業務,由於需要大量使用雲基礎設施與人力支持,因此運營毛利率始終較低。

雲基礎設施是一筆巨大的成本

在以內部軟件為主導的舊時代,產品交付的核心在於擺脫並淘汰物理運輸載體。

無論是在服務器上還是臺式機內,軟件的運行成本都將由買方承擔。如今,SaaS 成為新的銷售形勢,運行成本則重新回到供應商手中。大多數軟件廠商每月都需要支付大量 AWS 或者 Azure 賬單:軟件要求越高,賬單金額就越高。

事實證明,AI 技術的要求確實不低:

  • 訓練一套 AI 模型可能需要耗費數十萬美元(或者更高)的計算資源。儘管可以將其理解為一次性成本,但由於 AI 模型接納的數據始終隨時間推移而變化(這種現象被稱為“數據漂移”),因此模型的重複訓練應該被視為一種持續性成本。
  • 模型推理(在生產環境中生成預測結果的過程)在複雜度方面,同樣遠遠高於傳統軟件。與直接從數據庫內讀取數據相比,執行一連串矩陣乘法顯然需要更高的數學運算。
  • AI 與傳統軟件相比,AI 應用程序需要處理的更多是圖像、音頻或者視頻等富媒體類別。這類數據消耗的資源明顯高於常規存儲資源,處理成本更高,而且往往因領域不同而有所差別,應用程序可能需要處理大量文件,才能從中找到相關片段。
  • 根據 AI 廠商們的實際反饋,與傳統基礎設施相比,雲計算的運營複雜度更高、成本更可觀,而且往往缺少在全球範圍內輕鬆擴展 AI 模型的理想工具。結果就是,相當一部分 AI 廠商不得不定期在不同雲服務區域間遷移訓練完成的模型,用高昂的運營成本換取模型的可靠性、性能表現以及合規性。

總而言之,這部分因素導致 AI 廠商往往需要將全部成本中的 25% 甚至更高花在雲資源身上。在極端情況下,面對極複雜任務的初創企業甚至發現,在某些模型數據中採取手動處理反而成本更低。

當然,大家可以選擇專用 AI 處理器壓低成本。這類 AI 處理器能夠高效執行計算任務,從而通過優化技術(例如模型壓縮及交叉編譯)降低所需算力水平。

然而,這種優化思路的效率曲線並不明確。在相當一部分應用領域中,我們需要成倍增長的處理強度與數據量來換取更高的準確性。正如前文提到,這意味著模型的複雜度也會以驚人的速度增長,而處理器顯然跟不上這種需求提升。

自 2012 年以來,訓練前沿 AI 模型所需要的計算資源增長了 30 萬倍,而英偉達 GPU 的晶體管數量僅增長了 4 倍左右。分佈式計算無疑是解決此類難題的有效方式,但這解決的主要是速度問題,而非成本問題。

引入“人工操作”,成本高昂

這種包含人工操作的系統主要分為兩種形式,而且二者都會嚴重影響大部分 AI 初創企業的毛利率水平。

第一:當前大部分前沿 AI 模型的訓練過程,都涉及對大型數據集的手動清潔與標記。

整個過程費力、成本高昂,同時也成為 AI 技術廣泛推廣的最大障礙之一。另外如上所述,即使模型部署完成,訓練也仍然沒有結束。為了保持較好的準確度,企業需要持續捕捉並標記新的訓練數據,並將其反饋至系統中。雖然漂移檢測與主動學習等技術能在一定程度上減輕壓力,但統計數據顯示,大部分廠商都需要把總體成本中的 10% 到 15% 投入這一過程(通常不被計入核心工程資源)。這方面的成本支出,往往遠高於傳統軟件行業中的 bug 修復與功能補充工作。

第二:對於大部分任務,特別是需要大量認知推理操作的任務,AI 系統還是需要人類操作者的介入。

舉例來說,社交媒體企業會僱用數千名人工審核員,負責增強 AI 審核系統的判斷準確度。大部分無人駕駛汽車系統也包含遠程操作員,基於 AI 技術的醫療設備同樣需要與作為聯合決策者的醫生隨時交互。隨著我們對現代 AI 系統的功能及表現愈發瞭解,不少初創企業正在採用這種人類加機器的業務運營方式,同時把這部分內部服務與預期成本納入純軟件形式的 AI 產品當中。

隨著 AI 模型性能的提升,未來系統開發對人工干預的依賴性有望不斷下降。不過徹底擺脫人類介入恐怕仍不現實。無人駕駛汽車等應用場景過於複雜,現有 AI 技術還沒有能力實現全面自動化。此外,AI 系統中的安全、公平與信任問題同樣有賴於人工監督的支持,美國、歐盟以及其他多個國家和地區正著手製定 AI 法規,相信其中會著力強調這方面要求。

隨著 AI 模型性能的提升,未來系統開發對人工干預的依賴性有望不斷下降,不過徹底擺脫人類介入仍不現實。

即使某些任務最終實現了全面自動化,我們也不太清楚這到底能幫企業提高多少利潤。AI 應用程序的基本功能在於處理輸入數據流,並生成相應的預測結果。因此,AI 系統的運營成本集中體現在處理數據量的函數身上。某些數據點需要人工處理(成本相對高昂),其他數據點則由 AI 模型自動處理(成本相對低廉,至少希望如此)。但歸根結底,每條輸入都必須經過處理,不是人工、就是自動。

因此,到目前為止,我們已經探討了兩大成本類別,分別為雲計算與人工支持。減少其中一項,往往會導致另一項直線上升。雖然兩個成本方程式都有優化空間,但不管怎麼優化,都暫時沒辦法達到與 SaaS 業務相似的極低成本水平。

AI 系統的擴展比預期困難

對於 AI 企業來說,尋找適合市場需求的產品要比傳統軟件業務難得多。特別是在對接了 5 到 10 家理想客戶之後,大家會發現 ML 團隊的工作積壓情況愈發嚴重,客戶部署計劃難以為繼,極大的工作強度甚至讓企業無法拓展新的業務。

總體來看,造成這種局面的罪魁禍首是那些難以避免的極端狀況。大部分 AI 應用程序都擁有著開放的接口,能夠處理噪音比例頗高的非結構化數據(例如圖像或者自然語言)。用戶則對產品缺乏直覺,更糟糕的是,他們會假設自己選擇的 AI 產品擁有等同甚至超越人類的能力。兩相結合,極端狀況必將出現:我們開發的 AI 產品中,將有 40% 到 50% 的功能僅僅是為了服務這些極端狀況而存在。

換句話說,用戶可以也必然會把幾乎所有內容,都一股腦塞進 AI 應用程序當中。

應對這種複雜的需求往往非常費力。由於潛在輸入範圍太過廣泛,每一套新的客戶部署方案都可能生成前所未有的數據。即使是看似需求相同的客戶(例如,兩家汽車製造商都希望利用 AI 實現缺陷檢測),實際需要的訓練數據也可能有所不同。

一位 AI 廠商創始人將這種現象稱為 AI 產品的“時間成本”。她的公司在面對每一位新客戶時,都會進行專門的數據收集與模型微調。如此一來,他們就能觀察客戶數據的分佈情況,同時在部署前消滅部分極端狀況。

但這種解決思路是有代價的:企業的團隊與財務資源被牢牢捆綁在一起,直至模型的準確性達到可接受的水平。訓練期的持續時間也往往難以預測,因為無論團隊如何努力,也很難找到快速獲取訓練數據的可行途徑。

AI 初創企業花在產品部署方面的時間與資源,往往遠超最初的預期。要命的是,提前發現實際需求根本就不現實,因為傳統的原型設計工具(例如模型、原型設計或者 Beta 測試)往往只覆蓋最常規的流程,而無法觸及極端狀況。

與傳統軟件一樣,整個評估流程在早期客戶群體中耗時最長。但與傳統軟件不同的是,AI 應用程序的評估流程不一定能隨時間推移而縮短。

AI 業務可持續運營仍是未解之謎

偉大的軟件企業源於穩固堅實的市場優勢,而優勢中最可靠的部分包括網絡效應、高遷移成本以及規模經濟。

當然,這些對 AI 企業也並非不可企及。競爭優勢的基礎通常表現為卓越的產品技術。第一家能夠開發出複雜軟件的廠商,一定能夠快速建立起品牌形象並享受一段壟斷式的美好時光。

在 AI 領域,技術的差異化卻很難實現。新的模型架構主要源自完全開放的學術環境。所有企業都能夠從開源庫中獲取參考實現方案(預訓練模型),並通過模型參數自動優化打造出只屬於自己的成果。數據是 AI 系統的核心,但這類資源卻通常被掌握在客戶手中,並被後者以商品的形式往來交易。

隨著市場的發展成熟,AI 成果的價值會逐步下降,而且網絡效應也相對較弱。在某些情況下,我們甚至觀察到 AI 業務中的數據饋送出現了規模越大、成本效益越差的情況。另外,隨著模型成熟度的提升,每種新的極端案例都會帶來更高的解決成本,因為它們只能解決極少部分客戶的一丁點需求。

但這裡需要強調,我們並不是說 AI 產品的優勢穩定性就一定比純軟件產品低。只不過對於 AI 企業而言,這種穩定性絕對不像很多人想象的那麼牢固。從保持優勢的角度出發,AI 很可能只是對接底層產品與數據的通道,並沒那麼特別。

給創始人的實用建議

在我們看來,AI 企業要想取得長期成功,最關鍵的工作就是應對挑戰,同時充分利用服務與軟件層面的優勢。秉承這一思路,創始人們可以採取多種手段推動現有或者後續 AI 應用方案的蓬勃發展。

儘可能消除模型複雜性。我們觀察到,只要一家初創企業能夠在全體客戶之間共享哪怕少部分模型(一組特定通用模型),主幹運營成本就會遠低於只能為每家客戶單獨訓練模型的廠商。

這種“同一模型”策略更易於維護,並且能夠更快適應新客戶的需求,同時也能成就更加簡單高效的工程組織結構。此外,“同一模型”策略還有助於降低數據流水線長度並減少訓練任務的重複運行,藉此顯著改善雲基礎設施使用成本。

雖然還不足以徹底解決 AI 業務的高成本問題,但這種簽訂協議前儘可能多瞭解客戶需求及其數據的方法確實有效。有時候,新客戶明顯會給機器學習工程帶來巨大負擔,但在大多數情況下,我們只需要對模型進行些許微調,只涉及少數幾套模型甚至是幾項參數。

認真審查並收縮問題領域,藉此降低數據複雜性。從本質上講,將人力勞動轉化為自動化形式絕非易事。不少企業發現 AI 模型的最低可行任務範圍侷限性很強,遠低於他們的預期。例如,某些 AI 團隊並不會宣揚自己掌握了處理一切常規文本的能力,而是將業務準確指向電子郵件處理或者求職簡歷修改意見,這就能引導客戶建立正確的預期。

CRM 領域的廠商已經意識到,AI 技術確實能夠根據更新記錄找到最具價值的內容。換句話說,AI 技術更擅長處理規模大、複雜度低的任務,包括審核、數據輸入 / 編碼以及轉錄等。專注於這類業務方向,能夠最大程度降低大家面對極端需求的可能性,保證將 AI 這塊好鋼用在刀刃上。

在我們看來,AI 企業要想取得長期成功,最關鍵的工作就是應對挑戰,同時充分利用服務與軟件層面的優勢。

針對變數較大的成本做好規劃。作為企業創始人,您應該為業務模式建立可靠且直觀的思維框架。

本文中討論的各項成本要素可能會在一定範圍內波動,但請不要假設這些會徹底消失。相反,我們建議大家以較低的毛利率為起點設計業務模型與產品上市策略。下面,我再簡要介紹幾條參考意見:深入理解模型數據的分佈情況。將模型維護與人工故障轉移視為首要問題。跟蹤並衡量變數較大的成本,千萬不要讓它們潛藏在研發成本中。在財務模型中做出保守的單位收益假設,這一點在融資週期內特別重要。最後,不要妄圖通過規模擴大或者技術進步來解決問題。

多做具體服務。認真考查市場需求,集中力量做好具體服務。舉例來說,大家需要推出的可能是全棧翻譯服務而非翻譯軟件,是出租車服務而非銷售無人駕駛汽車。建立混合業務確實要比建立純軟件業務更困難,但前者能夠幫助我們對客戶的需求建立起深刻洞察,並由此衍生出一家快速發展且由市場需求定義的靈活企業。此外,服務往往也會成為初創企業攻佔市場的絕佳工具。關鍵是,我們要以堅定的態度追求單獨一種策略,而不能總想著同時吸引軟件類客戶與服務類客戶。

為技術堆棧變更做好規劃。現代 AI 技術仍處於起步階段,我們才剛剛迎來第一批能夠幫助從業者高效、標準完成工作的工具。在接下來的幾年內,這類工具有望得到廣泛使用,逐步實現模型訓練自動化、提高推理效率、促進開發者工作流標準化,同時監控並保護生產環境中的 AI 模型。

總體來講,雲計算也將作為軟件公司面對的頭號成本對象而受到普遍關注。因此,如果將某種應用方案緊密耦合在當前工作方式當中,很有可能在不久的未來造成嚴重的結構性缺陷。

通過傳統方式建立競爭優勢。雖然我們還不清楚 AI 模型或者基礎數據本身是否足以支撐起穩定的競爭優勢,但好的產品與專有數據幾乎總能衍生出表現出色的業務。AI 技術為企業創始人帶來解決舊問題的新視角。例如,AI 技術在工作強度極大的惡意軟件檢測領域已經創造出顯著價值。只要初步產品擁有足夠獨特的功能,客戶粘性與業務持久性也是順理成章的收穫。有趣的是,我們發現有幾家 AI 企業甚至通過行之有效的雲戰略鞏固了自己的市場地位,也許這就是下一代新興開源公司的雛形。

結束語

從傳統意義上講,目前市場上的大部分 AI 系統都不屬於軟件。結果就是,AI 業務跟軟件業務表現出完全不同的面貌。AI 業務要求人力的持續投入,以及變數極大的成本支出。另外,AI 系統也沒我們想象中那麼易於擴展。最後,AI 方案的競爭優勢也並不容易保持(這與一次構建、隨處銷售的傳統軟件模式尤其不同)。

這些特徵的存在,讓 AI 很大程度上更像是服務行業。更具體地講,我們可以更換服務商,但卻無法徹底更換服務本身。

需要強調的是,這沒準是個好消息。畢竟成本變數、規模動態以及競爭優勢等指標最終還是要由市場(而非單一廠商)來決定。客戶對於如何處理數據仍然摸不著頭腦,所以 AI 企業快速佔領市場並創造出巨大的發展機遇。已經有不少偉大的 AI 廠商成功走出初期的迷霧,開發出性能表現極為穩定的卓越產品。

AI 技術仍處於從學術課題向生產型技術的早期過渡階段。這裡要提醒大家,全面掀起 AI 軟件開發浪潮的 AlexNet 僅僅誕生於不到八年前。可以肯定的是,智能化應用程序正在推動軟件行業前行,而我們也期待 AI 技術能夠早日步入新的發展時期。

本文作者為 Martin Casado 和 Matt Bornstein,Martin Casado 是風險投資公司 Andreessen Horowitz 的合夥人,專注於企業投資。他曾是 Nicira 的聯合創始人兼首席技術官,該公司於 2012 年被 VMware 以 12.6 億美元的價格收購。Martin 在 VMware 任職期間,曾擔任網絡和安全業務部的高級副總裁兼總經理。

Matt Bornstein 是 Andreessen Horowitz 企業交易團隊的合夥人,專注於支持當前人工智能浪潮的新數據系統和技術。他的任務是發現 AI/ML 的新穎應用,並幫助創始人解決此類新產品帶來的業務挑戰。

文中傳統軟件的毛利率估計是基於 publiccomps.com 上列出的一些公司得出的;服務公司的毛利率估算基於 1 萬份申報;人工智能業務的毛利率估算基於對人工智能初創公司創始人的幾次採訪

來源:獨訊頭條自媒體平臺:入駐獨訊頭條自媒體平臺,享受三億補貼


分享到:


相關文章: