人工智能憑藉什麼過關斬將?

人工智能憑藉什麼過關斬將?| 機器學習算法大解析

如果把人工智能比作過無關斬六將的關雲長,機器學習就如同他手中的那柄青龍偃月刀。

參考來源 / IEC:《Artificial intelligence across industries》白皮書

編譯 / Helen


機器學習是實現人工智能的方法,也是人工智能的核心。它是使用算法來解析數據、從中學習,然後對真實世界中的事件做出決策和預測。

本篇是人工智能專輯文章的第二篇,為大家歸類總結人工智能的三類工作方式、九大算法及五大應用系統。

人工智能到底是如何工作的?包含哪些常見的機器學習機制和主要算法?接下來的內容可能會有些燒腦,但足以讓你對人工智能實施的主要方法有個全局的瞭解。


三類工作方式

機器學習從數據中提取信息,按照工作方式把它分成三個主要的類別:監督學習、無監督學習和強化學習。

監督學習 如果數據集包含已知的輸入和輸出對,稱為監督學習。監督學習使用一組訓練數據來預測未知數據集的輸出值。使用監督學習開發的模型的性能取決於所採用的訓練數據集的大小和方差(數據選擇),以實現更好的泛化和對新數據集更好的預測能力。

無監督學習 在不定義預先指定屬性的情況下學習對數據集的實例進行分組,稱為無監督學習。該算法無需目標條件信息即可確定數據集的基礎結構。

強化學習 在強化學習中, AI系統以代理的形式與環境交互。代理能夠操作並觀察環境,並以獎懲的形式接收環境的反饋,通過執行動作並接收針對所述動作的獎懲來改進學習效果。通過重複執行動作並接收反饋, 代理就可以更好地通過價值函數近似估計執行動作的價值。

人工智能憑藉什麼過關斬將?| 機器學習算法大解析

▲ 強化學習

九大算法

決策樹 適用於分類和迴歸任務,是監督學習算法的一種形式。決策樹使用訓練數據以圖形方式概述決策規則及其結果。分類樹會產生分類或離散結果,而回歸樹會預測連續值。因為容易解釋、準確性高,決策樹成為非常流行的機器學習技術。

人工智能憑藉什麼過關斬將?| 機器學習算法大解析

▲ 決策樹

支持向量機 SVM算法處理監督機器學習問題,可應用於分類和迴歸任務。該算法的基本概念是線性劃分不同的類別,將數據集提供的類之間的距離最大化。為了實現最佳的分類,該算法使用可令不同類別之間的間隔最大化的數據點。定義了分隔開不同類別的直線上的那些被選中的數據點叫做支持向量,這就是SVM算法名稱的由來。

樸素貝葉斯 是一類基於貝葉斯定理的監督學習算法。有一個普遍的假設,即所有這些算法都可以共享以對數據進行分類。被分類數據的每個特徵都獨立於該類別中所有其它特徵。當一個特徵的值發生變化對其它特徵的值沒有影響時,認為該特徵是獨立的。貝葉斯算法被應用於文本檢索或垃圾郵件分類等許多任務。

k最近鄰 k-NN算法通常用於監督分類和迴歸,但也可以應用於無監督聚類。該算法被稱為惰性學習者,因為只需要保存數據直到需要對新數據進行分類,根據存儲的數據點對新數據進行分類,因此分類結果始終取決於當前的訓練數據。k-NN算法的基本思想是根據與待分類數據距離最近 的k個數據點對數據進行匹配分類。

人工智能憑藉什麼過關斬將?| 機器學習算法大解析

▲ K最近鄰

k均值聚類 聚類問題中提供了一個未標記的數據集,聚類算法將其自動分組為相干的子集或聚類。k均值算法是用於此類任務的最受歡迎的算法之一。k均值算法首先隨機初始化數據集中的k個隨機點 (稱為聚類質心)。然後重複執行兩個步驟:分配和質心重定位。在聚類分配步驟中,該算法遍歷給定數據集中的每個樣本,並根據最近距離將每個樣本分配給一個初始化的質心。對每個數據點重複此操作 ,直到將每個樣本分配給一個簇。第二步,算法計算分配給特定簇的每個數據點的平均距離,然後將質心移動到計算出的平均位置。對所有k個簇重複該步驟。該算法進行迭代,直到聚類質心不再變化為止,這意味著k均值算法已收斂到k個聚類。

隱馬爾科夫模型 HMM是一種創建線性序列概率模型的有用算法。該算法的基本概念是馬爾可夫過程,它假設系統在任何時候都可以被描述為處於一組獨特的狀態。在間隔開的離散時間上,系統根據與狀態相關的一組概率在狀態之間變化。馬爾可夫模型中的隱藏狀態表示不可直接觀測的隨機過程,它只能通過另一組產生觀測序列的隨機過程間接觀測。HMM的應用範圍包括DNA和蛋白質分析中的序列建模、信息檢索系統和音頻測序。

人工神經網絡 人工神經網絡(ANN)是受到人腦啟發誕生的一種基於神經網絡(感知器)的算法,具有很強的通用性。一個神經網絡由多個不同的層組成,每一層都包含與上一層所有人工神經元相連的人工神經元。輸入層表示輸入數據,由數值組成,可以處理結構化數據(例如溫度傳感器輸出)和非結構化數據(例如圖像像素)。根據隱藏層中哪些單元被激活,輸出層單元將提供預測。

人工智能憑藉什麼過關斬將?| 機器學習算法大解析

▲ 人工神經網絡

卷積神經網絡 (CNN)與普通ANN有很多相似之處。它們同樣都由神經元組成,而且這些神經元的權重和偏差會在學習過程中進行調整。整個網絡仍表示單個可區分的得分函數,並且有一個成本函數鏈接到最後一個全連接層上。但是,與常規前饋神經網絡相反,CNN明確假定其輸入為圖像,它們可以將某些屬性編碼到網絡的體系結構中,讓前向函數的實現更加有效,並且大大減少了參數的數量。

遞歸神經網絡 (RNN)是一種特殊類型的人工神經網絡。它們可以應用於監督學習和無監督學習,也可以用於強化學習。ANN在把當前輸入數據考慮進去時假設它們和之前的數據無關,但RNN能夠計入之前數據的影響。ANN的神經元只有來自先前層的輸入,但RNN神經元的輸出上帶有循環,因此RNN的神經元對其先前的輸出具有依賴性。這種特性使得此類算法能夠覆蓋序列預測問題,例如單詞的語境或時間關係。

人工智能憑藉什麼過關斬將?| 機器學習算法大解析

▲ 遞歸神經網絡


五大應用系統

計算機視覺 計算機視覺就是用計算機模擬人類視覺系統,以識別物體或人。它通常利用機器學習算法來識別圖片中的模式,並利用這些模式對圖像進行分類。計算機視覺任務包括獲取、處理、分析和理解數字圖像以及從現實世界中提取高維數據以產生數字或符號信息(例如決策)的方法。

人工智能憑藉什麼過關斬將?| 機器學習算法大解析

▲ 計算機視覺

異常檢測 任何必須識別出偏離預期模式的偏差的應用都需要異常檢測,例如欺詐檢測、健康監護或計算機系統入侵檢測。異常檢測有三大類。

  • 無監督異常檢測技術會在未標記的測試數據集中檢測異常,其前提是假設,與看起來最不適合數據集的其餘實例比起來,數據集中的大多數實例是正常的。
  • 有監督異常檢測技術需要一個標記了“正常”和“異常”的數據集,並涉及到訓練分類器的使用。
  • 半監督異常檢測技術會根據給定的正常訓練數據集構建一個表示正常行為的模型,然後測試通過該學習模型生成測試實例的可能性。


時間序列分析 描述了一種在一組時間序列數據中查找模式的分析方法。目的是識別可能被噪聲掩蓋的數據趨勢,並正式對其進行描述。此外,還可以使用時間序列分析預測該序列的未來值,以便進行預測。

自然語言處理 NLP是計算機以一種智能方式來分析、理解人類語言並從中獲得意義的方法。通過利用NLP ,開發人員可以組織和構造知識來執行自動摘要、翻譯、命名實體識別、關係提取、情感分析、語音識別和主題分割之類的任務。

人工智能憑藉什麼過關斬將?| 機器學習算法大解析

▲ 自然語言處理

推薦系統 推薦器或推薦系統為用戶預測與其偏好相匹配的項目。推薦系統的流行通常是基於數字內容或服務的使用,在這種情況下可以更容易地根據用戶的評分識別用戶的偏好。該任務經常使用協作過濾算法,但樸素貝葉斯和k-NN算法也很受歡迎。


分享到:


相關文章: