本文在透徹剖析深度學習及機器學習的同時,就多方面對兩者進行比較,進而探究其未來的發展趨勢。
深度學習及機器學習
A. 機器學習
機器學習是人工智能技術的補充,有如下幾種常用算法:
- Find-S
- 決策樹
- 隨機森林算法
- 神經網絡
機器學習算法通常分為以下三大類:
- 有監督學習:需要從有標籤的數據中學到或者建立一個模式。
- 無監督學習:數據是無標籤的,機器學習算法需要先將數據分類,然後對數據結構進行描述,使複雜的數據看起來簡單,以便進行後續分析工作。
- 強化學習 :與監督學習相似,通過不斷地探索學習,從而獲得一個好的策略。
B. 深度學習
機器學習更多關注解決現實世界的問題,與人工智能技術有異曲同工之妙。機器學習則是通過模擬人類決策能力的神經網絡找出問題解決方法。深度學習可看作是特殊的機器學習,我們可以利用深度學習來解決任何需要思考的問題。
深度神經網絡由三種類型的層組成:
- 輸入層
- 隱藏層
- 輸出層
C.深度學習VS機器學習
我們使用機器學習算法解析數據,並根據從數據中學習到的知識做出決策。深度學習利用各個層組合創建人工“神經網絡”,它能夠智能地學習和做出決策。深度學習可以說是機器學習的子領域。
D. 深度學習和機器學習區別
1. 數據依賴
深度學習與機器學習的主要區別是在於性能。當數據量很少的時候,深度學習的性能並不好,因為深度學習算法需要大量數據才能很好理解其中蘊含的模式。
2. 硬件支持
深度學習算法嚴重依賴高端機,而傳統的機器學習算法在低端機上就能運行。深度學習需要GPUs進行大量的矩陣乘法運算。
3. 特徵工程
特徵工程就是將領域知識輸入特徵提取器,降低數據複雜度。從時間和專業性來講,這個過程開銷很高。
4. 解決方案
通常,我們使用傳統的算法解決問題。這需要將問題化整為零,分別解決,得到結果後再將其進行組合。
示例:
假設我們需要對多個目標進行探測,識別這些目標都是什麼,確定它們在圖片中的位置。利用機器學習算法,我們可將該問題分為兩個部分:
- 目標檢測
- 目標識別
首先,我們使用grabcut算法掃描全圖,以期找到可能的目標。接著,對所有疑似目標使用目標識別算法(如SVM/HOG)進行識別。
5. 執行時間
由於深度學習中含有非常多的參數,較機器學習而言會耗費更多的時間。機器學習在訓練數據的時候費時較少,同時只需幾秒到幾小時。
6. 可解釋性
應用場景
計算機視覺:車牌識別,人臉識別
信息檢索:搜索引擎,文本檢索,圖像檢索
營銷:自動郵件營銷,目標識別
醫療診斷:癌症檢測,異常檢測
自然語言處理:語義分析,照片標記,在線廣告投放
展 望
1. 機器學習和數據科學發展勢頭強勁,對想要生存下來的企業來說,在業務中使用機器學習變得越發重要。
2. 深度學習已被證明是現有技術中最先進的技術之一,它給人們帶來了無限多的驚喜,未來仍將如此。
3. 研究學者們仍在不斷探索機器學習和深度學習。過去,對於二者的研究僅侷限於學術範圍,現在工業界也加大了對其的研究力度。
更多資訊,盡在阿里雲科技快訊~
來科技快訊看新聞鴨~
閱讀更多 阿里雲科技快訊 的文章