2019-01-06 07:56:00 AI上金融

機器學習是人工智能（AI）研究和應用的一個分支，它是一門“古老”又“新興”的計算機科學技術。早在1950年，圖靈在發表的論文《計算及其與智能》中提出了“圖靈測試”，用來判斷機器是否具備人工智能的標準。

圖靈測試：“如果通過問答這種方式，我們已經無法區分對話那端到底是機器還是人類，那麼就可以說這樣的機器已經具備人工智能”

機器學習發展歷程

從20世紀50年代開始，人工智能進入“推理期”，該階段通過賦予機器邏輯推理能力使機器獲得智能，當時的AI程序能夠證明一些著名的數學定理，但由於機器缺乏知識，遠不能實現真正的智能。因此，70年代，人工智能進入了“知識期”，該階段主要是總結人類的知識，並將知識灌入機器，從而使機器獲得智能。在這一階段，大量的專家系統問世，在許多領域取得很大的成果，但是由於人類的知識量巨大，故出現了“知識工程瓶頸”。無論是“推理期”還是“知識期”，機器都是按照人類設定的規則和總結的知識運作，永遠無法超越其創造者，另外人力資源成本太高，不適合人工智能的進一步發展。

需要轉換思路進行探索，這個思路就是“機器學習（Machine Learning）”，至此人工智能進入“機器學習時期”。“機器學習時期”也分為三個階段：

80年代，連接主義較為流行，代表工作有感知機（Perceptron）和神經網絡（Neural Network）。
90年代，統計學習方法開始佔據主流舞臺，代表性方法有支持向量機（Support Vector Machine）
進入21世紀，深度神經網絡被提出，連接主義捲土從來，隨著數據量和計算能力的不斷提升，以深度學習（Deep Learning）為基礎的諸多AI應用逐漸成熟。

機器學習系統特點

從機器學習的各個階段來看，我們可以總結出機器學習系統具備如下特點

① 機器學習系統所解決的都是無法直接使用固定規則或流程代碼完成的問題，通常這些問題都是人類很輕易都能做到的；
② 具備“學習”能力的程序都是指它能夠不斷地從歷史數據中吸取教訓，從而應對未來的預測任務。
③ 機器學習系統具備不斷改善自身應對具體任務的能力。

機器學習的經典定義來自於美國卡內基梅隆大學的著名教授Tom Mitchell，定義如下：

如果一個程序在使用既有經驗（E）執行某類任務（T）的過程中被認定是“具備學習能力的”，那麼它一定需要展現出：利用現有經驗（E），不斷改善其完成既定任務（T）的性能（P）的特質。

下面重點介紹一下機器學習三要素：任務（T）、經驗（E）、性能（P）

機器學習任務（T）

機器學習的任務分類有三種，分別是監督學習、無監督學習和半監督學習，其中半監督學習可以理解為部分監督和部分無監督的學習，本文將重點介紹前兩種。

監督學習

監督學習主要關注對事物未知表現的預測，一般分為分類問題（classification）和迴歸問題（regression）。

分類問題：是對其所在的類別進行預測。類別是離散的，同時預先知道數量的。比如：通過身高、體重、三圍、穿衣情況 預測這個人的性別。
迴歸問題：同樣是預測問題，只是預測的目標是連續的變量。例如：通過性別、體重、身高、年齡 預測基礎代謝率（BMR）。

無監督學習

無監督學習傾向於對事物本身特性的分析，常用的技術包括數據降維（dimensionality Reduction）和聚類問題（clustering）等。

數據降維：是對事物的特徵進行壓縮和篩選，比如人臉識別任務中，我們通常會使用降維技術對圖像進行降維，保留最具有區分度的像素組合。
聚類：依賴於數據的相似性，把相似的數據劃分為一類。但大多數情況下，我們不知道類的個數及類的含義。比如根據股票的價格、成交量等進行聚類，看看是否統計出相似的股票集群。

機器學習經驗（E）

機器學習經驗就是我們所說的數據。並不是所有的信息對學習任務都有用，通常把這些反映數據內在規律的信息叫做特徵(Feature)。比如人臉圖識別任務並不是把圖像最原始的像素信息直接交給學習系統，而是通過降維和其他數據處理方法得到更加有利特徵。

監督學習數據

監督學習使用的數據，包括特徵和目標(Label/Target)兩個部分。我們一般用一個特徵向量(Feature Vector)來描述一個數據樣本，目標的表現形式則取決於監督學習的種類。

無監督學習數據

無監督學習使用的數據沒有目標，因此也無法從事預測任務，因此只能對數據結構進行分析。正是因為無監督數據的沒有目標，所以不用耗費大量的時間、金錢和人力，所以數據量相對較多。

另外，除了目標的表現形式存在離散、連續變量的區別,從原始數據到特徵向量轉化的過程中也會遇到多種數據類型：類別型(Categorical)特徵、數值型(Numerical)特徵,甚至是缺失的數據(Missing Value)等。實際操作過程中,我們都需要把這些特徵轉化為具體的數值參與運算。

機器學習性能（P）

機器學習性能是評價所完成任務質量的指標。為了評價學習模型完成任務的質量，需要將模型的預測結果同正確答案進行對比。我們稱這樣的數據集為測試集。

另外出現在測試集中的數據樣本一定不能被用於模型訓練，否則會出現過擬合現象。簡而言之，訓練集與測試集之間應該是彼此互斥的。

對待預測性質的問題,需要關注預測的精準度。分類問題,我們要根據預測正確類別的百分比來評價其性能,這個指標通常被稱作準確性(Accuracy)；而回歸問題則無法使用類似的指標,通常會衡量預測值與實際值之間的偏差大小來進行判斷。

好了，看到這裡大家是否瞭解機器學習具體是什麼，要做什麼什麼事情呢？如有疑問，歡迎大家留言！

分享到:

閱讀更多 AI上金融 的文章

關鍵字: 數據結構 2018頭條記憶人工智能

01.06 機器學習入門：一文讓你快速瞭解機器學習

機器學習發展歷程

機器學習系統特點

機器學習任務（T）

機器學習經驗（E）

機器學習性能（P）

相關文章:

01.06 機器學習入門：一文讓你快速瞭解機器學習

機器學習發展歷程

機器學習系統特點

機器學習任務（T）

機器學習經驗（E）

機器學習性能（P）

相關文章:

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

為什麼馬鈴薯不宜過早過遲播種？

疫情愈發嚴重，原油為何反而大漲？

生菜球很好吃，怎麼種植才能高產呢？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？ ？

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

書友們展示一下自我感覺發揮較好的作品，一起學習？

如果你正經歷生活中“餘歡水”式的悲劇，各種不順會怎麼想、怎麼做？-比奇堡的槓把子丶的回答-悟空問答

美國可以不斷印美元，但它為什麼不這麼做呢？-宋思考的回答-悟空問答

手抓餅怎麼做才好吃？-布穀姐美食日記的回答-悟空問答

擀麵條時，用什麼粉能有效防止麵條的粘連？-家常美食小廚房的回答-悟空問答

濟南至西安遊不走回頭路怎樣安排路線求大神指點？-自駕遊八方的回答-悟空問答

從濟南出發3天左右的自駕遊，不去海邊不去爬山，有什麼推薦的地方嗎？-泉城自駕遊俱樂部的回答-悟空問答

吳三桂為啥不接受削藩？做富家翁不香嗎？-老森的回答-悟空問答

玉米饅頭怎麼做？-明澤美食的回答-悟空問答

支付寶支付，微信支付對印鈔造幣公司有影響嗎？-澤哥愛基金2020的回答-悟空問答

央行數字貨幣誕生，能顛覆支付寶、微信支付的位置嗎？-慧算賬的回答-悟空問答

今年由於疫情的影響小學延期開學，暑假是否繼續上學補課呢？-PRINCE的回答-悟空問答

疫情之下，我們如何應對，老百姓該如何準備？-蒔涘的回答-悟空問答

湖南寧遠九嶷山美不美？有何遊玩攻略呢？-寶哥碎碎遊的回答-悟空問答

五一快到了，去國外旅遊安全還是國內旅遊安全，哪個地方最保險？-馬德里官方發言人的回答-悟空問答

疫情過後，你有什麼變化？（請用最簡單的語言陳述）？-滿足176482102的回答-悟空問答

男人一生愛過幾個女人才算正常？-鵬獻舞的回答-悟空問答

時間會治癒一個人的傷嗎？-小凡聊趣事的回答-悟空問答

為什麼美國確診58萬多，死亡兩萬多，還不宣佈美國為疫區國？-自在來賢的回答-悟空問答

孩子在學習看圖寫話的時候，不知道怎麼動筆，要怎麼引導？-草木一卒的回答-悟空問答

如何培養孩子畫畫的習慣？-觀上書苑的回答-悟空問答

小孩子學畫畫的圖案一般都去哪找比較好？-職場詭事的回答-悟空問答

繪畫真的需要天賦嗎？-大臉貓的畫的回答-悟空問答

為什麼有些人在小學對繪畫感興趣到了高中就不感興趣了？-學做書的蜜瓜的回答-悟空問答

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？