人工智能7大關鍵技術,終於有人講明白了

導讀:企業使用AI的一個複雜因素是,這個主題包含了多個不同的底層技術。這些技術中大多數都能夠完成很多替代功能。技術和功能的組合非常複雜,表1-1列出了7項關鍵技術,包括每項技術的簡要描述,以及它們可以實現的一些典型功能或應用程序。

人工智能7大關鍵技術,終於有人講明白了

表1-1 人工智能關鍵技術

本文會更深入地描述這個表中的每種技術及其功能。我還將論述每種技術在商業AI世界有多普遍。我的本職工作是商學院的教授(跟很多不同的公司合作過),但我也是德勤戰略和分析實踐部門的高級顧問,該部門整合了人工智能方面的諮詢工作。

下面是對每一項技術及其功能的深入描述。

作者:托馬斯·H. 達文波特(Thomas H. Davenport)

來源:華章科技

人工智能7大關鍵技術,終於有人講明白了

01~03 統計機器學習、神經網絡和深度學習

機器學習是一種自動將模型與數據匹配,並通過訓練模型對數據進行“學習”的技術。機器學習是AI最常見的形式之一。

在2017年德勤對250位經理(其所在公司都已經在探索AI)開展的“瞭解認知”調查中,接受調查的公司58%在其業務中採用了機器學習。它是許多人工智能方法的核心技術並且有很多的版本。公司內部和外部數據(尤其是這些外部數據)的爆炸式增長使它們採用機器學習來全面理解這些數據變得既可行又必要。

神經網絡是機器學習的一種更為複雜的形式,該技術出現在20世紀60年代,並用於分類型應用程序,例如確定信貸交易是否為欺詐行為。它根據輸入、輸出、變量權重或將輸入與輸出關聯的“特徵”來分析問題。它類似於神經元處理信號的方式,但把它比作大腦就有些牽強了。

最複雜形式的機器學習將涉及

深度學習,或通過很多等級的特徵和變量來預測結果的神經網絡模型。得益於當前計算機架構更快的處理速度,這類模型有能力應對成千上萬個特徵。

與早期的統計分析形式不同,深度學習模型中的每個特徵通常對於人類觀察者而言意義不大。這導致的結果就是該模型的使用難度很大或者難以解釋。在德勤的調查中只有34%的人在使用深度學習技術。

深度學習模型使用一種稱為反向傳播的技術,通過模型進行預測或對輸出進行分類。AI技術已推動了該領域的許多最新進展,從在圍棋大賽中擊敗人類專家到對互聯網圖像進行分類,便是使用反向傳播的深度學習。在多倫多大學及谷歌任職的傑弗裡·辛頓(Geoffrey Hinton)通常被稱為深度學習之父,部分原因就在於他在反向傳播方面的早期研究。

人工智能7大關鍵技術,終於有人講明白了

機器學習採用了上百種可能的算法,其中大多數算法有些深奧。它們的範圍從梯度增強(一種構建用於解決先前模型錯誤的模型的方法,從而增強預測或分類能力)到隨機森林(作為決策樹模型集合的模型)。

越來越多的軟件工具(包括DataRobot、SAS和谷歌的AutoML)支持機器學習模型的自動構建,這些模型可以嘗試許多不同的算法來找出最成功的算法。一旦通過訓練數據找到了能夠進行預測或分類的最佳模型,就可以部署它,並對新的數據進行預測或分類(有時稱為評分過程)。

除了所使用的算法外,機器學習的另一個關鍵是模型如何進行學習。有監督學習模型(到目前為止是業務中最常用的類型)是使用一組對輸出做了標記的訓練數據進行學習。

例如,一個試圖預測銀行欺詐行為的機器學習模型需要在一個明確構成欺詐案例的系統上接受訓練。這並不容易做到,因為實際欺詐的頻率可能只有十萬分之一(有時稱為不平衡分類問題)。

有監督學習與在評分模型中部署的傳統分析方法(如迴歸分析)非常相似。在迴歸分析中,目標是創建一個模型,使用一組與輸出有關而且其值已知的輸入變量來預測一個已知結果。一旦模型開發完成,就可以用它通過相同輸入變量的已知值來預測一個未知的結果。

例如,根據患者的年齡、體育活動水平、熱量消耗和體重指數,我們可以開發迴歸模型來預測他患上糖尿病的可能性。

我們針對已確診患有糖尿病或沒患糖尿病的患者建立模型(通常使用所有可用數據來建立迴歸模型)。一旦找到了合適的預測迴歸模型,就可以使用它基於一組新的數據來預測未知的結果(輸入變量達到特定等級時患者患上糖尿病的可能性)。其後的活動(在迴歸分析和機器學習中)稱為評分。

迴歸過程與有監督的機器學習相同,除了:

  • 在機器學習中,用於開發(訓練)模型的數據稱為訓練數據,而且它可以是明確出於訓練目的而保留的數據子集;
  • 在機器學習中,通常用另一個數據子集來驗證訓練模型,該子集的預測結果是已知的;
  • 在迴歸中,可能不需要使用模型來預測未知結果,相反在機器學習中則會對結果做假設;
  • 機器學習中可以使用許多不同的算法類型來代替簡單的迴歸分析。

開發無監督模型通常更難一些,它要從未做標記的數據中檢測模式並預測未知的結果。

強化學習是第三種變體,它是指機器學習系統制訂了目標而且邁向目標的每一步都會得到某種形式的獎勵。它在玩遊戲中非常有用,但也需要大量數據(在許多情況下,太多的數據對該方法不起作用)。

需要指出的是,有監督的機器學習模型通常不會持續學習。它們從一組訓練數據中學習然後繼續使用同一個模型,除非使用新的一組訓練數據來訓練新的模型。

機器學習模型是以統計為基礎的,而且應該將其與常規分析進行對比以明確其價值增量。它們往往比基於人類假設和迴歸分析的傳統“手工”分析模型更準確,但也更復雜和難以解釋。相比於傳統的統計分析,自動化機器學習模型更容易創建,而且能夠揭示更多的數據細節。

考慮到學習所需的數據量,深度學習模型在圖像和語音識別等任務上非常出色(遠遠優於以前針對這些任務的自動化方法,並且在某些領域接近或超過了人類的能力)。

人工智能7大關鍵技術,終於有人講明白了

04 自然語言處理

自20世紀50年代以來,理解人類語言一直是人工智能研究者的目標。這一領域被稱為自然語言處理(Natural Language Processing,NLP),包括諸如語音識別、文本分析、翻譯、生成的應用程序及其他與語言有關的目標。

在“瞭解認知”的調查中,53%的公司在使用NLP。NLP有兩種基本方法:統計NLP和語意NLP。統計NLP是以機器學習為基礎,而且其性能提升的表現要快於語意NLP。它需要一個龐大的“語料庫”或者語言體系來學習。

例如,在翻譯中它需要大量的翻譯文本,而通過統計分析可以發現西班牙語和葡萄牙語中的amor在統計上與英語中的love一詞高度相關。這雖然有點靠“蠻力”,但通常是相當有效的方法。

語義NLP是近十年來唯一的現實選擇,如果能用單詞、語法和概念之間的關係有效地對系統進行訓練那麼它就會相當高效。

語言的訓練和知識工程(通常指為特定領域所創建的知識圖譜)可能會消耗大量的人力和時間。然而,它需要開發知識主體或者單詞與短語之間的關係模型。雖然創建語義NLP模型難度很大,但現在有些智能座席系統已經在使用該方法。

NLP系統的性能應該用兩種方法來衡量。一種是看它能夠理解百分之多少的口語。隨著深度學習技術的發展,該指標不斷提高而且往往超過95%。

衡量NLP的另一種方法是看它能回答多少種不同類型的問題或者看它能解決多少種問題。這通常都需要語義NLP,但是由於這方面並沒有重大的技術突破,所以問答系統和問題解決系統都要基於特定的上下文而且必須進行訓練。

IBM沃森在回答《危險邊緣》的問題時表現出色,但是除非進行訓練(通常都是以勞動力密集型的方式),否則它回答不了《命運之輪》(Wheel of Fortune,一檔綜藝節目)的問題。也許深度學習在未來會應用於問題解答,但現在它還沒有。

人工智能7大關鍵技術,終於有人講明白了

05 基於規則的專家系統

在20世紀80年代,AI的主導技術是基於“if-then”規則集合的專家系統,而且在那個時代開始廣泛地應用於商業領域。如今人們往往認為它沒有那麼先進了,但是2017年德勤“瞭解認知”的調研顯示引入AI的美國公司裡有49%使用了該技術。

專家系統要求人類專家和知識工程師在特定知識領域中構建一系列規則。例如,它們通常用於保險承銷和銀行信貸承銷中(但也用於一些深奧的領域,如福爵咖啡的咖啡烘焙或金寶湯罐頭的湯汁調製)。

專家系統在一定程度上運行良好,而且容易理解。然而,當規則的數量很大(通常超過幾百條),並且規則開始相互衝突時,它們往往會崩潰。而且如果知識領域發生了變化,那麼更改規則將會很困難而且也會很耗時。

基於規則的系統自其早期的全盛時期以來並沒有太大的改進,但是保險和銀行等大量使用它們的行業還是希望能夠出現新一代基於規則的技術。

研究人員和廠商已經開始討論“自適應規則引擎”,該引擎將基於新的數據或規則引擎與機器學習的組合來不斷修改規則,但它們確實還沒有得到廣泛應用。

06 物理機器人

鑑於全球每年安裝的工業機器人超過20萬臺,物理機器人已經廣為人知。在美國“瞭解認知”調查中,32%的公司在某種程度上使用了物理機器人。它們在工廠和倉庫等地執行起重、重新定位、焊接或裝配產品等任務。歷史上,這些機器人始終在細緻的計算機程序控制下去執行特定的任務。

然而,當下的機器人變得越來越能夠跟人類協作,而且更加容易訓練,只需要根據預定的任務來移動機器人的部件就可以了。隨著其他AI能力嵌入它們的“大腦”(實際上是它們的操作系統)中,它們也變得更加智能。隨著時間的推移,我們在AI的其他領域中看到的改進很可能會被融入物理機器人中。

人工智能7大關鍵技術,終於有人講明白了

07 機器人流程自動化

機器人流程自動化(Robotic Process Automation,RPA)技術在執行結構化數字任務(即涉及信息系統的任務)時就如同一個人類用戶按照一個腳本或者規則在工作。關於RPA是否屬於AI/認知技術的集合存在著爭論,因為它不是十分智能。但是由於RPA系統非常流行、自動化,且越來越智能化,因此我把它也視為AI世界的一份子。

有人把它們稱為“數字勞動力”,而且與其他形式的AI相比,它們價格低廉、易於編程,而且行動透明。如果你會操作鼠標、能理解流程圖並能理解一些if-then業務規則,那麼你可以理解甚至開發RPA。這些系統也比其他方法(例如,用編程語言開發自己的程序)更容易配置和實施。

RPA並不真正涉及機器人,它只是服務器上的計算機程序。它依賴於工作流、業務規則及信息系統集成的“表示層”的結合體,作為系統的半智能用戶進行工作。

有些人將RPA與電子表格中的宏進行了比較,但是我認為這不是一個公平的比較,

RPA可以執行更為複雜的任務。還有人將它與業務流程管理(Business Process Management,BPM)工具進行了比較,後者可能具有一些工作流功能,但通常旨在記錄和分析業務流程,而不是實際將其自動化。

一些RPA系統已經具有一定程度的智能。它們可以“觀察”人類同事的工作(例如回答常見的客戶問題),然後模仿他們的行為。其他一些則把過程自動化與機器視覺相結合。與物理機器人一樣,RPA系統正慢慢地變得更加智能化,其他類型的AI技術也被用來指導它們的行為。

我對這些技術分別進行了描述,但是現實中它們越來越多地被組合和集成。然而就目前而言,瞭解什麼樣的技術可以完成什麼樣的任務對一個業務決策者來說是非常重要的。

全球公司(Global Inc.)首席信息官克里希納·內森(Krishna Nathan)指出,他在2018年的一個關鍵優先事項是“幫助我的利益干係人瞭解人工智能能做什麼和不能做什麼,以便我們能以正確的方式使用它”。也許在將來,這些技術將混雜在一起,以至於這樣的理解將不再必要,甚至不可行。

關於作者:托馬斯·H. 達文波特(Thomas H.Davenport),美國巴布森學院(Babson College)信息技術與管理專業傑出教授,獲哈佛大學哲學博士學位,並先後授課於哈佛商業學院、芝加哥大學和波士頓大學。曾任埃森哲戰略變革研究院主任,研究領域廣泛,包括信息和知識管理、再造工程以及信息技術在商業中的應用。

本文摘編自《數字時代的企業AI優勢:IT巨頭的商業實踐》,經出版方授權發佈。

人工智能7大關鍵技術,終於有人講明白了

延伸閱讀《數字時代的企業AI優勢》

推薦語:重點解讀了IBM、Amazon、臉書和Google等IT巨頭企業如何將AI運用到商業應用中。關注企業如何利用人工智能/認知技術來獲得商業利益和競爭優勢。


分享到:


相關文章: