Python數據挖掘入門與實踐:帶你入門數據挖掘技術並應用實際項目

前言

本篇作為數據挖掘入門讀物,介紹了數據挖掘的基礎知識、基本工具和實踐方法,通過循序漸進地講解算法,帶你輕鬆踏上數據挖掘之旅。


本篇採用理論與實踐相結合的方式,呈現瞭如何使用決策樹和隨機森林算法預測美國職業籃球聯賽比賽結果,如何使用親和性分析方法推薦電影,如何使用樸素貝葉斯算法進行社會媒體挖掘,等等。

本篇也涉及神經網絡、深度學習、大數據處理等內容。

本篇面向願意學習和嘗試數據挖掘的程序員。
全面釋放Python的數據分析能力,掌握大數據時代核心技術,輕鬆入門數據挖掘技術並將其應用於實際項目。


Python數據挖掘入門與實踐:帶你入門數據挖掘技術並應用實際項目


本篇主要分為12章的內容,由於細節內容實在是太多了,所以小編只把部分知識點截圖出來粗略的介紹,每個小節都有更加細化的內容。

第1章開始數據挖掘之 旅,介紹我們即將用到的技術,接著通過講解兩個基礎算法的實現方法達到熱身目的。

第2章用scikit-learn估計器分類, 涵蓋了數據挖掘的-一個重要主題一分類。 這一章還會介紹將數據挖掘流程標準化的流水線結構,便於你管理實驗流程。

第3章用決策樹預測獲勝球隊, 介紹決策樹和隨機森林兩個新算法。我們將通過抽取區分度高的特徵來預測獲勝選手。

Python數據挖掘入門與實踐:帶你入門數據挖掘技術並應用實際項目

第4章用 親和性分析方法推薦電影,思考根據以往消費記錄推薦產品的問題,介紹Apriori算法。

第5章用轉 換器抽取特徵,介紹不同類別特徵的抽取方法及不同數據集的處理方法。

第6章使用樸素貝葉斯進行社會媒體挖掘,使用樸素貝葉斯算法自動分析來自社交網站Twitter的文本信息。

第7章用圖挖掘找到感興趣的人, 採用聚類和網絡分析方法, 發現社會媒體上感興趣的人。

第8章用神經網絡 破解驗證碼,從圖像中抽取信息,然後訓練神經網絡,來發現圖像中的單詞和字母。

Python數據挖掘入門與實踐:帶你入門數據挖掘技術並應用實際項目

第9章作者歸屬問題, 通過抽取文本特徵,使用支持向量機算法。

第10章新聞語料分類, 使用k-means聚類算法, 根據新聞文章內容進行分類。

第11章用深度學 習方法為圖像中的物體進行分類,採用深度神經網絡算法確定圖像中的物體。

Python數據挖掘入門與實踐:帶你入門數據挖掘技術並應用實際項目

第12章大數據處理, 探討對大數據進行數據挖掘的流程及方法。

Python數據挖掘入門與實踐:帶你入門數據挖掘技術並應用實際項目

由於篇幅限制,所以小編就不做過的介紹啦,需要本【Python數據挖掘入門與實踐】技術文檔的小夥伴,就可以轉發關注小編,私信小編“學習”來得到獲取方式啦~~~~


Python數據挖掘入門與實踐:帶你入門數據挖掘技術並應用實際項目

在數據規模急速膨脹的大數據時代,數據挖掘這項甄別重要數據的核心技術正發揮越來越重要的作用。它將賦予你解決實際問題的“超能力”:預測體育賽事結果、精確投放廣告、根據作品的風格解決作者歸屬問題,等等。

本篇使用簡單易學且擁有豐富第三方庫和良好社區氛圍的Python語言,由淺入深,以真實數據作為研究對象,真刀實槍地向讀者介紹Python數據挖掘的實現方法。通過本篇,讀者將邁入數據挖掘的殿堂,透徹理解數據挖掘基礎知識,掌握解決數據挖掘實際問題的最佳實踐!

理解決策樹、樸素貝葉斯、支持向量機和深度學習

運用常見算法為解決現實問題建立數據模型

利用API從Reddit等網站獲取數據集

從數據集中找出並提取特徵

使用數據集設計並開發數據挖掘應用

基於實時數據,進行大數據處理


分享到:


相關文章: