機器學習有什麼技術含量?

shaolina


我們分兩個部分回答這個問題:1.什麼是機器學習;2.機器學習有什麼技術含量。

1.什麼是機器學習?

我們從定義和應用兩方面去了解

  • 定義:機器學習的定義主要參考維基百科
維基百科(中文)的定義:機器學習是人工智能的一個分支,實現人工智能的一個途徑,即以機器學習為手段解決人工智能的問題。機器學習在近30年已發展為一門多學科領域交叉科學,涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。

從上述定義中我們總結出機器學習的特點:1.人工智能的分支,2.多學科交叉


  • 應用:目前機器學習已廣泛應用於數據挖掘、計算機視覺、自然語言處理、生物特徵識別、搜索引擎、醫學診斷、證券市場分析、DNA序列測序、語音和手寫識別、戰略遊戲和機器人等領域。深度學習和強化學習為機器學習的熱門分支。

  • 而目前最火熱的深度學習是機器學習的一個新領域,由Hinton等人於2006年提出,基於深度置信網絡(DBN)提出非監督貪心逐層訓練算法,為解決深層結構相關的優化難題帶來希望,隨後提出多層自動編碼器深層結構。此外Lecun等人提出的卷積神經網絡是第一個真正多層結構學習算法,它利用空間相對關係減少參數數目以提高訓練性能。


<strong>2.機器學習有什麼技術含量:

從以上的描述中我們已經直覺的感到機器學習好像很複雜,技術含量挺高的,下面我們從專利數據中更客觀的瞭解機器學習的技術含量。

專利:某個領域的專利的數量可以很客觀的反應這個領域的技術含量是多少,專利越多,所包含的技術含量約高。

從圖中可以看出,人工智能領域的專利僅次於半導體領域,遠遠高於硬件和軟件行業


那麼機器學習具體有什麼技術含量呢?我們從三個部分去了解,它們是機器學習的三駕馬車:算法,框架,硬件


  • 算法:強化學習和深度學習是機器學習的兩大熱門分支

  1. 機器學習:相關算法包括邏輯迴歸、隱馬爾科夫方法、支持向量機方法、K近鄰法、三層人工神經網絡方法、Adaboost 算法、貝葉斯方法以及決策樹方法等。
  2. 強化學習:強化學習是智能體從環境到行為映射的學習,以使獎勵最大化。 常見的算法包括Q-learning,貝爾曼方程,深度Q網絡(DQN),深度確定性策略梯度。
  3. 深度學習: 典型的深度學習算法包括深度置信網絡、卷積神經網絡、受限玻爾茲曼機和循環神經網絡,生成式對抗網絡等。其中卷積神經網絡、循環神經網絡是兩類典型的模型。卷積神經網絡常被應用於空間性分佈數據;循環神經網絡在神經網絡中引入了記憶和反饋,常被應用於時間性分佈數據。


  • 框架:框架是進行機器學習的基礎底層結構,一般包含主流的神經網絡算法模型,提供穩定的機器學習API,支持訓練模型在服務器和GPU、TPU間的分佈式學習,部分框架還具備在包括移動設備、雲平臺在內的多種平臺上運行的能力。目前主流的開源框架有TensorFlow、Caffe/Caffe2、CNTK、 MXNet、Paddle-paddle、Torch/PyTorch、Theano 等。

  • 硬件:硬件是機器學習的基礎,為機器學習提供強大高效的算力。傳統的CPU芯片架構已無法滿足機器學習等大規模並行計算的需求,取而代之的是GPU,TPU等可以用於性能加速的硬件、神經網絡芯片、傳感器與中間件,這些是支撐人工智能應用的前提。


智終極


大數據,統計與概率


電氣自動化愛好者


數據,特徵工程


分享到:


相關文章: