Python之機器學習,揭祕人工智能的時代

很多人想要搭上人工智能這列二十一世紀的快車,不斷的順應著互聯網時代的變化,力求在這個不斷革新的時代領域博得自己的一片立足之地。


同樣在高速發展的時代,人工智能這個名詞似乎讓我們不再陌生,伴隨而來固然是機器學習領域的新潮。


Python之機器學習,揭秘人工智能的時代


可能很多人對於‘機器學習’這個全新的名詞瞭解之甚少,所以今天太灰狼就來和大家聊一聊‘機器學習’到底存在著怎樣的神秘色彩?


到底什麼是機器學習?


通俗的來講,機器學習(Machine Learning, ML)是一門多領域的交叉學科,它涉及的領域很廣,包括概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。


是專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。從而通過一系列的行為進化,讓機器更加便捷逼真的為人類所用。


機器學習是AI人工智能的核心,是使計算機具有智能的根本途徑,

其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹,同樣,它也是一門讓冷冰冰的機器賦予人性的高級學科。其目的就是為了設計和分析一些可以讓計算機自動學習的算法。


Python之機器學習,揭秘人工智能的時代


它有哪些切實的用途?


截止目前,機器學習在互聯網、醫學及其他領域已經有了十分廣泛的應用,例如:數據挖掘、計算機視覺、自然語言處理、生物特徵識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略遊戲和機器人運用,這些都需要機器學習的不斷深入和開發,才能達到更高的效率的應用需求。


接下來大灰狼就簡單的和大家介紹一下機器學習的基本內容和簡單的學習方法,


對於機器學習算法,它是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的算法。


因為學習算法中涉及了大量的統計學理論,而機器學習與統計推斷學聯繫尤為密切,所以也被稱為統計學習理論。在算法設計方面,機器學習理論關注可以實現的、行之有效的學習算法。很多推論問題屬於無程序可循難度,所以部分的機器學習研究是開發容易處理的近似算法。


Python之機器學習,揭秘人工智能的時代


而對於機器學習,大灰狼也有以下幾方面的建議和大家分享。


01

不要試圖掌握所有知識後再開始學習


其實對於很多領域的學習都是這樣,並且幾乎每一個都不是獨立存在的,它或多或少的都會與其他相關領域有一定的關聯和互通性。


因此我們在對相關領域的知識進行學習的時候,並不需要先將其涉及的內容通學一遍,這樣不可避免的就會造成很多時間上的浪費,同時學習的效率也會相對低下。而對於機器學習領域來說也是這樣。一般來說,機器學習的課程和書籍有:


線性代數:矩陣/張量乘法、求逆,奇異值分解/特徵值分解,行列式,範數等


統計與概率:概率分佈,獨立性與貝葉斯,最大似然(MLE)和最大後驗估計(MAP)等


優化:線性優化,非線性優化(凸優化/非凸優化)以及其衍生的求解方法如梯度下降、牛頓法、基因算法和模擬退火等


微積分:偏微分,鏈式法則,矩陣求導等


信息論、數值理論等


Python之機器學習,揭秘人工智能的時代


對於一般人來說,學習完這些相關知識往往需要很長的時間和精力,容易半途而廢,而且這些相關知識是工具而不是目的,我們的目的還是對機器學習有一定的瞭解和實踐,因此這些課程完全可以在對機器學習的同時,有針對性的補充和了解,這樣有目的性且耗時更低。


02

不要把深度學習作為入門第一課


雖然很對人學習‘機器學習’都是衝著深度學習來的,但把深度學習作為機器學習的第一課,並不是一個好的舉措,原因如下:


  • 深度學習的黑箱性更加明顯,很容易學得囫圇吞棗
  • 深度學習的理論/模型架構/技巧還在一直變化當中,並未塵埃落定
  • 深度學習實驗對硬件要求高,不太適合自學或者使用個人電腦進行學習


因此學習機器學習可以先從最基礎的入門開始,相關資料公眾號回覆‘機器學習’獲取。


03

不要收集過多的資料&分辨資料的時效性


雖然機器學習的興起時間並不算太長,但機器學習的資料很多,動輒就有幾個G的材料可以下載或者觀看。而很多朋友都有“收集癖”,甚至一下子購買十幾本書,但到真正用到的並無多少。


機器學習的發展和變化速度很快。在入門期間,建議“小而精”的選擇資料,選擇近期出版的且口碑良好的書籍即可。


Python之機器學習,揭秘人工智能的時代


下面大灰狼來和大家聊一下機器學習前期的相關準備


硬件條件


另一個大家常問的問題是:是否可以用自己的筆記本電腦進行機器學習。答案是肯定的,大部分市面上的數據集都可以放到你的內存中運行。


在入門階段,我們很少會用到非常大的數據集,一般最大也就是MNIST,完全可以使用個人筆記本電腦進行運行。在Windows筆記本上也可以用GPU進行深度學習,相關教程公眾號回覆‘機器學習’獲取,請不要打著學習的名義重新購買機器…


軟件選擇


如果要做深度學習,大灰狼首推Linux,因為其對很多學習模型支持比較好(主要是深度學習的Library)。但即使你使用的是Windows系統,也可以用虛擬機裝Ubuntu來進行學習。對於小型的深度學習模型足夠了,大型的深度學習我們通暢也很少在本地/個人計算機上運行。


至於編程語言,首推Python,因為Python具有良好的拓展支持性,主流的工具包都有Python版本。但特定情況下,選擇R作為編程語言也是可以的。其它可能的語言還包括C++、Java和Matlab,但我個人不大推薦。畢竟根據機器學習的走向來看,Python在機器學習上的應用也在進一步的的得到推廣。


寫在最後


雖然很多人曾說二十一是生物的世紀,但現在互聯網的時代早已到來,這是屬於人工智能的世紀。你若瞭解機器學習,就會發現數據分析也有它自己的魅力。


讓每個人都可以嘗試將機器學習知識應用於他們原本的領域,摒棄人為製造的知識壁壘。唯有這樣,機器學習技術才能在更多的不同領域落地,從而反哺機器學習研究本身。


科技日新月異,我們不鄙棄追逐熱點的人。但在這個浮躁的時代,不管選擇什麼方向最重要的就是獨立思考的能力,和去偽存真的勇氣。


因此,看完這篇文章,你可能仍然瞭解甚少,但每一份知識的學習都是無窮無盡的,我最希望的是你既不要急著全盤接受,也不要因為不對胃口全盤否定。慢下來,好好想想,制定適合自己的計劃,這不僅是做科學工作的正確態度。更是我們每一個人對待生活的態度!


Python之機器學習,揭秘人工智能的時代


拒絕外界的噪音,無論是鼓勵還是嘲笑,抱著‘長風破浪會有時,直掛雲帆濟滄海’的信念,堅定不移的努力下去,終有一天你會發現,成功大門的鑰匙早已被你納入囊中!


相關資料請關注微信公眾號‘灰狼洞主’回覆‘機器學習’獲取!


分享到:


相關文章: