有哪些网络爬虫和数据分析的书籍值得推荐?

又又双叒叕平


我来提供一些以Python语言讲解的爬虫与数据分析书籍吧。


首先,关于网络爬虫:

  1. 崔静才:《Python3网络爬虫开发实战》,基础且全面,案例翔实,且他有自己的个人博客,有问题可以与他线上沟通。强烈推荐。https://cuiqingcai.com/5052.html.

  2. 《requests中文文档》:requests是常用的Python爬虫库,强大、易用,且文档可读性非常好,建议阅读。http://docs.python-requests.org/zh_CN/latest/.

  3. 虫师:《selenium2 python自动化测试实战》 :崔静才的书中也有讲Selenium,但是不够详细,想学习Selenium所见即所得式抓取的,可以再阅读下虫师的这一本书。

  4. 《用Python写网络爬虫》:国外书籍,有中文版。

  5. 《Python网络数据采集》:国外书籍,有中文版。


其次,关于数据分析:

  1. 《利用Python进行数据分析》:现在已经有了第二版,这本书是学习Python数据分析、数据处理的经典之作,基本也是必读书目。作者是鼎鼎大名的数据分析库pandas的作者。强烈推荐。

  2. 《Python数据科学手册》:由浅入深,全面的入门书。强烈推荐。

  3. 《Python数据可视化之matplotlib实战》:可能是最好的matplotlib可视化入门书,强烈推荐。


入门之后,有更多的可选书籍,你可以自行搜索阅读。另外,推荐阅读正版书籍哦。


大数据揭秘


网络爬虫,也有叫网页蜘蛛或网络机器人的。

网络爬虫书籍很多的,你看你想从哪门语言入手。

比如说,你熟悉了JAVA编程,你可以看看这本书《自己动手写网络爬虫》。这本书网上有下载的。

不管用什么语言实现,一般你得理解这几样事情:

其一,对爬取目标的描述或定义;

其二,对网页的数据的分析或过滤;

其三,对URL的搜索策略,

最后,你得理解爬虫的实现原理。这样才能采取合适的实现方式。

当然,现在网上更多的是用Python实现的,这个书籍就更多了……比如《Python爬虫开发与项目实战》。

记住,因为这是个应用型的,所以书籍一定得有项目案例。

随着大数据的崛起和AI的应用,数据爬去也会遇到很多机遇与挑战,这个是有些意思的事情。

数据的价值在应用,这是核心!……

好了,就这些么多啦。


牛旦教育IT课堂


《Web数据挖掘》Bing Liu著,清华大学出版社非常好。

这位大佬是Web数据挖掘领域的牛人,第8至第9章专门讲爬虫问题,前5章讲数据挖掘基础,其他章节讲数据挖掘在Web中的各种应用。


分享到:


相關文章: