怎樣成為一名真正的數據科學家?這10本書就是答案

導讀:社交、出行、辦公、購物、娛樂……一個生活在2020年的人,每天要產生多少數據?這些數據將怎樣改變我們的生活、工作和思維方式?將創造哪些價值?這些價值又該怎樣挖掘?

數據科學家被《哈佛商業評論》稱為“21世紀最性感的職業”,那麼怎樣成為一名真正的數據科學家?今天推薦的10本書,一定能讓你變得更“性感”。

01 Python機器學習(原書第2版)

怎樣成為一名真正的數據科學家?這10本書就是答案

作者:塞巴斯蒂安·拉施卡 瓦希德·米爾賈利利

推薦語:本書將帶領你進入預測分析的世界,並展示為什麼Python會成為數據科學領域首屈一指的計算機語言。如果你想更好地從數據中得到問題的答案,或者想要提升並擴展現有機器學習系統的性能,那麼這本基於數據科學實踐的書籍非常值得一讀。

本書自第1版出版以來,備受廣大讀者歡迎。與同類書相比,本書除了介紹如何用Python和基於Python的機器學習軟件庫進行實踐外,還對機器學習概念的必要細節進行討論,同時對機器學習算法的工作原理、使用方法以及如何避免掉入常見的陷阱提供直觀且翔實的解釋,是Python機器學習入門必讀之作。

02 數據中心一體化最佳實踐:設計倉儲級計算機(原書第3版)

怎樣成為一名真正的數據科學家?這10本書就是答案

推薦語:本書由谷歌3位資深專家親筆撰寫,利用多個真實案例,探討新型系統如何在將數據中心本身當作超大規模倉儲級計算機使用的同時,又能使軟硬件充分協同以提供高性能的互聯網服務。

03 文本數據管理與分析:信息檢索與文本挖掘的實用導論

怎樣成為一名真正的數據科學家?這10本書就是答案

推薦語:

信息檢索與數據挖掘領域世界知名學者、ACM Fellow、美國伊利諾伊大學香檳分校(UIUC)翟成祥教授厚積薄發之作,基於UIUC數據管理與分析相關課程多年的積累,覆蓋作者兩門在線課程“文本檢索與搜索引擎”和“文本挖掘與分析”的主要內容。

04 計算機時代的統計推斷:算法、演化和數據科學

怎樣成為一名真正的數據科學家?這10本書就是答案

作者:布拉德利·埃夫隆 特雷福·黑斯蒂

推薦語:統計推斷入門經典,斯坦福大學知名教授、《The Elements of Statistical Learning》作者Trevor Hastie全新力作。彙集重要統計思想,系統闡釋統計推斷近60年的演化史,深入剖析各種經典算法及應用。

05 數據挖掘:概念與技術(原書第3版)

怎樣成為一名真正的數據科學家?這10本書就是答案

作者:Jiawei Han, Micheline Kamber 等

推薦語:數據挖掘領域最具里程碑意義的經典著作,完整全面闡述該領域的重要知識和技術創新。

本書完整全面地講述數據挖掘的概念、方法、技術和研究進展。本書對前兩版做了全面修訂,加強和重新組織了全書的技術內容,重點論述了數據預處理、頻繁模式挖掘、分類和聚類等的內容,還全面講述了OLAP和離群點檢測,並研討了挖掘網絡、複雜數據類型以及重要應用領域。

06 統計學習導論:基於R應用

怎樣成為一名真正的數據科學家?這10本書就是答案

作者:加雷斯·詹姆斯 丹妮拉·威滕 等

推薦語:統計學習是一套以複雜數據建模和數據理解為目的的工具集,是近期才發展起來的統計學的一個新領域。本書出自統計學習領域聲名顯赫的幾位專家,結合R語言介紹了分析大數據必不可少的工具,提供一些最重要的建模和預測技術,並藉助豐富的實驗來解釋如何用R語言實現統計學習方法。

本書不僅是優秀的“統計學習”或“機器學習”課程的教材,也是數據挖掘、數據分析等相關從業者不可或缺的參考書。

07 數據科學與大數據技術導論

怎樣成為一名真正的數據科學家?這10本書就是答案

作者:奧弗·曼德勒維奇 凱西·斯特拉 等

推薦語:使用Hadoop和Spark解決實際數據科學問題的專業人士,如今越來越缺乏。本書就是幫助讀者提升為這種奇缺人士的完全指南。借鑑在Hadoop和大數據方面的豐富經驗,三大頂尖專家在本書中彙集了讀者所需要的一切:高層次的概念、深潛的技術、現實的用例、實際的應用和易上手的教程。

08 社交媒體數據挖掘與分析

怎樣成為一名真正的數據科學家?這10本書就是答案

作者:加博爾·薩博 格爾·波拉特坎 等

推薦語:社交媒體是大數據的豐富來源。瞭解社交媒體數據最有效的挖掘方法能夠幫助你獲得產生驚人業績的信息。

由任職社交網絡公司的業界專家所撰寫的本書提供了一個實踐教程,教授你如何使用最新的工具和專門針對社交媒體的複雜數據挖掘技術。本書深入剖析了收集和應用社交媒體數據的機制,以理解用戶、定義趨勢並做出預測,從而改善對增長和銷售的分析。

09 統計反思:用R和Stan例解貝葉斯方法

怎樣成為一名真正的數據科學家?這10本書就是答案

推薦語:本書能增加你對統計模型的理解和信心。現在,基於模型的統計對編程有基本的要求,本書能促使你一步一步地計算原本自動的過程。書中獨特的計算過程可確保你瞭解足夠的細節,以便你在建模工作中合理地選擇和解釋模型。

本書從貝葉斯的角度介紹了廣義線性分層模型,通過貝葉斯概率和最大熵的基礎邏輯解釋模型,涵蓋從基礎的迴歸分析到分層模型的內容。作者還討論了測量誤差、缺失數據,以及處理空間和網絡自相關的高斯過程模型。

10 利用Python進行數據分析(原書第2版)

怎樣成為一名真正的數據科學家?這10本書就是答案

推薦語:Python數據分析經典暢銷書全新升級。Python pandas創始人親自執筆,Python語言的核心開發人員鼎立推薦。針對Python 3.6進行全面修訂和更新。


分享到:


相關文章: