人工智慧、機器學習、數據挖掘和數據分析之間,主要有什麼聯繫?

人工智能是目前炙手可熱的一個領域,所有的互聯網公司以及各路大迦們紛紛表態人工智能將是下一個時代的革命性技術,可與互聯網、移動互聯網時代的變更相媲美;AlphaGo在圍棋領域戰勝人類最頂尖的棋手讓大眾第一次直觀的認識到了人工智能的威力和強大,於是大家都不禁在思考到底什麼是人工智能, 它將給人類帶來怎樣的變化和未來?

人工智能、機器學習、數據挖掘和數據分析之間,主要有什麼聯繫?


0.人工智能

人工智能英文縮寫為AI,它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學研究領域的一個重要分支,又是眾多學科的一個交叉學科,它企圖瞭解智能的實質,並生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括語音識別、圖像識別、機器人、自然語言處理、智能搜索和專家系統等等,人工智能可以對人的意識、思維的信息過程的模擬。人工智能包括眾多的分支領域,比如大家熟悉的機器學習、自然語言理解和模式識別等。

1.機器學習

機器學習屬於人工智能研究與應用的一個分支領域。機器學習的研究更加偏向理論性,其目的更偏向於是研究一種為了讓計算機不斷從數據中學習知識,而使機器學習得到的結果不斷接近目標函數的理論。

機器學習,引用卡內基梅隆大學機器學習研究領域的著名教授Tom Mitchell的經典定義:

如果一個程序在使用既有的經驗E(Experience)來執行某類任務T(Task)的過程中被認為是“具備學習能力的”,那麼它一定要展現出:利用現有的經驗E,不斷改善其完成既定任務T的性能(Performance)的特質。

機器學習已經有了十分廣泛的應用,例如:數據挖掘、計算機視覺、自然語言處理、生物特徵識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略遊戲和機器人運用。在我們當下的生活中,語音輸入識別、手寫輸入識別等技術,識別率相比之前若干年的技術識別率提升非常巨大,達到了將近97%以上,大家可以在各自的手機上體驗這些功能,這些技術來自於機器學習技術的應用。

那機器學習與數據挖掘的聯繫是什麼呢?

機器學習為數據挖掘提供了理論方法,而數據挖掘技術是機器學習技術的一個實際應用。逐步開發和應用了若干新的分析方法逐步演變而來形成的;這兩個領域彼此之間交叉滲透,彼此都會利用對方發展起來的技術方法來實現業務目標,數據挖掘的概念更廣,機器學習只是數據挖掘領域中的一個新興分支與細分領域,只不過基於大數據技術讓其逐漸成為了當下顯學和主流。

2.數據挖掘

數據挖掘一般是指從大量的數據中通過算法搜索隱藏於其中信息的過程。數據挖掘本質上像是機器學習和人工智能的基礎,它的主要目的是從各種各樣的數據來源中,提取出超集的信息,然後將這些信息合併讓你發現你從來沒有想到過的模式和內在關係。這就意味著,數據挖掘不是一種用來證明假說的方法,而是用來構建各種各樣的假說的方法。數據挖掘不能告訴你這些問題的答案,他只能告訴你,A和B可能存在相關關係,但是它無法告訴你A和B存在什麼相關關係。機器學習是從假設空間H中尋找假設函數g近似目標函數f。數據挖掘是從大量的數據中尋找數據相互之間的特性。

數據挖掘是基於數據庫系統的數據發現過程,立足與數據分析技術之上,提供給為高端和高級的規律趨勢發現以及預測功能;同時數據量將變得更為龐大,依賴於模式識別等計算機前沿的技術;其還有另外一個名稱為商業智能(BI, Business Intelligence),依託於超大型數據庫以及數據倉庫、數據集市等數據庫技術來完成。

主要挖掘方法有: 分類 、 估計、預測、相關性分組或關聯規則、 聚類、複雜數據類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)等技術。

3.深度學習

深度學習的概念源於人工神經網絡的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特徵形成更加抽象的高層表示屬性類別或特徵,以發現數據的分佈式特徵表示。晦澀難懂的概念,略微有些難以理解,但是在其高冷的背後,卻有深遠的應用場景和未來。

那深度學習和機器學習是什麼關係呢?

深度學習是實現機器學習的一種方式或一條路徑。其動機在於建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據。比如其按特定的物理距離連接;而深度學習使用獨立的層、連接,還有數據傳播方向,比如最近大火的卷積神經網絡是第一個真正多層結構學習算法,它利用空間相對關係減少參數數目以提高訓練性能,讓機器認知過程逐層進行,逐步抽象,從而大幅度提升識別的準確性和效率。

神經網絡是機器學習的一個分支,而深度學習又是神經網絡的一個大分支,深度學習的基本結構是深度神經網絡。

4.數據分析

數據分析的概念:基於數據庫系統和應用程序,可以直觀的查看統計分析系統中的數據,從而可以很快得到我們想要的結果;這個就是最基本的數據分析功能,也是我們在信息化時代了,除了重構業務流程、提升行業效率和降低成本之外的了。另外數據分析更多的是指從歷史數據裡面發現有價值的信息,從而提高決策的科學性。數據分析更側重於通過分析數據的歷史分佈然後從中得出一些有價值的信息。還有一個數據分析更重要的功能,就是數據可視化。

比如說,在財務系統的信息化中,基於企業的財務系統,我們可以直觀獲取企業現金流量表、資產負債表和利潤表,這些都來自與我們的數據分析技術。數據分析目前常用的軟件是Excel, R, Python等工具。

在對比數據分析和數據挖掘時,數據分析則更像是對歷史數據的一個統計分析過程,比如我們可以對歷史數據進行分析後得到一個粗糙的結論,但當我們想要深入探索為什麼會出現這個結論時,就需要進行數據挖掘,探索引起這個結論的種種因素,然後建立起結論和因素之間模型,當有因素有新的值出現時,我們就可以利用這個模型去預測可能產生的結論。

因此數據分析更像是數據挖掘的一箇中間過程。

5.總結

人工智能與機器學習、深度學習的關係

嚴格意義上說,人工智能和機器學習沒有直接關係,只不過是機器學習的方法被大量的應用於解決人工智能的問題而已。目前機器學習是人工智能的一種實現方式,也是最重要的實現方式。

深度學習是機器學習比較火的一個方向,其本身是神經網絡算法的衍生,在圖像、語音等富媒體的分類和識別上取得了非常好的效果。

數據挖掘與機器學習的關係

數據挖掘主要利用機器學習界提供的技術來分析海量數據,利用數據庫界提供的技術來管理海量數據。

機器學習是數據挖掘的一種重要方法,但機器學習是另一門學科,並不從屬於數據挖掘,二者相輔相成。

深度學習、機器學習的發展帶了許多實際的商業應用,讓虛幻的AI逐步落地,進而影響人類社會發展;

深度學習、機器學習以及未來的AI技術,將讓無人駕駛汽車、更好的預防性治療技術、更發達智能的疾病治療診斷系統、更好的人類生活娛樂輔助推薦系統等,逐步融入人類社會的方方面面。

AI即使是現在,也是未來,不再是一種科幻影像和概念,業界變成了人類社會當下的一種存在,不管人類是否喜歡或者理解,他們都將革命性地改變創造AI的我們人類自身;

在不久的將來,多智時代一定會徹底走入我們的生活,有興趣入行未來前沿產業的朋友,可以收藏多智時代,及時獲取人工智能、大數據、雲計算和物聯網的前沿資訊和基礎知識,讓我們一起攜手,引領人工智能的未來


分享到:


相關文章: