又又双叒叕平
我来提供一些以Python语言讲解的爬虫与数据分析书籍吧。
首先,关于网络爬虫:
崔静才:《Python3网络爬虫开发实战》,基础且全面,案例翔实,且他有自己的个人博客,有问题可以与他线上沟通。强烈推荐。https://cuiqingcai.com/5052.html.
《requests中文文档》:requests是常用的Python爬虫库,强大、易用,且文档可读性非常好,建议阅读。http://docs.python-requests.org/zh_CN/latest/.
虫师:《selenium2 python自动化测试实战》 :崔静才的书中也有讲Selenium,但是不够详细,想学习Selenium所见即所得式抓取的,可以再阅读下虫师的这一本书。
《用Python写网络爬虫》:国外书籍,有中文版。
《Python网络数据采集》:国外书籍,有中文版。
其次,关于数据分析:
《利用Python进行数据分析》:现在已经有了第二版,这本书是学习Python数据分析、数据处理的经典之作,基本也是必读书目。作者是鼎鼎大名的数据分析库pandas的作者。强烈推荐。
《Python数据科学手册》:由浅入深,全面的入门书。强烈推荐。
《Python数据可视化之matplotlib实战》:可能是最好的matplotlib可视化入门书,强烈推荐。
入门之后,有更多的可选书籍,你可以自行搜索阅读。另外,推荐阅读正版书籍哦。
大数据揭秘
网络爬虫,也有叫网页蜘蛛或网络机器人的。
网络爬虫书籍很多的,你看你想从哪门语言入手。
比如说,你熟悉了JAVA编程,你可以看看这本书《自己动手写网络爬虫》。这本书网上有下载的。
不管用什么语言实现,一般你得理解这几样事情:
其一,对爬取目标的描述或定义;
其二,对网页的数据的分析或过滤;
其三,对URL的搜索策略,
最后,你得理解爬虫的实现原理。这样才能采取合适的实现方式。
当然,现在网上更多的是用Python实现的,这个书籍就更多了……比如《Python爬虫开发与项目实战》。
记住,因为这是个应用型的,所以书籍一定得有项目案例。
随着大数据的崛起和AI的应用,数据爬去也会遇到很多机遇与挑战,这个是有些意思的事情。
数据的价值在应用,这是核心!……
好了,就这些么多啦。
牛旦教育IT课堂
《Web数据挖掘》Bing Liu著,清华大学出版社非常好。
这位大佬是Web数据挖掘领域的牛人,第8至第9章专门讲爬虫问题,前5章讲数据挖掘基础,其他章节讲数据挖掘在Web中的各种应用。