Python需要安裝哪些工具包？

2018-07-22 05:42:50 佚名

每日一發小視頻

python要裝多少包，這個要取決於你用python做什麼工作了，基本上，在每一個應用方向都有專業的包。

python自帶了許多功能強大的包，比如：爬蟲包urllib,正則表達式包re，計算包collections，還有圖形包tkinter等等，這些包在你安裝python的時候就已經自動安裝了，當然，這都是基礎的包，我們日常用到的更多的是第三方包，因為第三方包功能更為強大。

作為數據挖掘人員，我先說一下日常用到的框架或者說模塊。

python本來自身是沒有很好的數據處理能力的，因為的他的基本數據結構就是那幾種，列表，字典，集合，元組等，無法使用到高維數組，更沒有提供矩陣運算的能力，但是！第三方庫numpy的出現，使python具備了處理數據和矩陣的能力，然後在此基礎上，出現更友好的處理數據的庫，scipy，pandas，這些都是基於numpy庫而來的，當然還有機器學習庫scikit-learn，這個模塊提供了強大的全面的機器學習算法，而且接口相對十分簡單，讓數學或者統計學工作者能很快上手。

所以，一個數據挖掘人員，日常使用就是這些：numpy，scipy，pandas，scikit-learn，還有數據可視化包matplotlib，這些日常處理數據，構建模型，結果可視化必備的工具。

但是這麼多包，他們之間又有相互依賴，一個個的安裝是個大問題，這裡推薦安裝anaconda，python的科學計算版本，自帶了上述的庫，十分方便，免除安裝的苦惱。

爬蟲是學習python有趣途徑，同樣有強大的框架

python自帶的urllib其實使用起來有點麻煩，推薦你使用requests庫，這是一個非常強大，使用方便的庫，而且有全面的中文文檔，網上爬數據爬圖片都不在話下。

還有更高級的庫-scrapy庫。

Scrapy是一個為了爬取網站數據，提取結構性數據而編寫的應用框架。其可以應用在數據挖掘，信息處理或存儲歷史數據等一系列的程序中。

Scrapy 使用了 Twisted異步網絡庫來處理網絡通訊。整體架構大致如下

爬取網站數據，當然少不了正則模塊re，還有beautiful soup模塊

re模塊具有強大的處理字符串的能力，但是使用起來並不簡單，因為當你覺得可以使用正則表達式的時候，這本身就是一個問題，因為寫出一個正則表達式就是一個大問題。不過不用怕，在處理網站結構的數據時，有更強大的庫-beautiful soup

Beautiful Soup 是一個可以從HTML或XML文件中提取數據的Python庫，擁有完善的中文文檔，提供了種類繁多的屬性和方法供你選擇，讓你解析網站數據更加的得心應手！

web後端框架django，flask

python在web開發方面也是多面手，既有大而全的框架django，又有小而精的框架flask。

雖說在web開發方面有許多框架，但是最常用的還是這兩種，如果你想做中方面的工作，學好這兩個框架就夠用了，而且，目前的python後端開發的招聘需求多半是要求會這兩個框架。

python後端開發目前有不少公司在使用，比如，我們常見的知乎，豆瓣等都是

度學習和人工智能

說起深度學習，人工智能，當然少不了提到tensorflow，keras等流行的框架，而這都可以使用python進行友好的操作，如果你有志於人工智能，那麼你一定不能錯過python

分佈式計算框架spark

python無法進行分佈式計算，這是一個很大的缺陷，不過現在已經不是問題了，因為spark為python提供了極為友好的接口pyspark

有效的桌面gui庫-pyqt5

安裝很容易

PyQt5是一套綁定Qt5的應用程序框架。他在Python 2.x和3.x中都是可用的。PyQt5是作為一套Python模塊實現的。他已經超過620個類和6000個函數與方法。

除了以上模塊，python還有好多有用的模塊

比如：

中文分詞模塊jieba

圖片處理模塊PIL模塊

操作數據庫模塊pymysql、pymongo等

操作excel模塊xlrd，xlwt；

處理json數據的模塊json

基本上你需要的功能，python都有對應的模塊提供實現功能

愛數據的小司機

這麼說吧，缺啥補啥，用到什麼了你就安裝什麼，缺少什麼安裝包，你就安裝就行，不用非得把成千上萬個安裝包都安裝上，不科學也不現實。

就好像R語言一樣，安裝包超級多，你用什麼包的時候就去安裝即可，一下子在安裝R語言的時候，將包全部進行下載，系統盤都裝不下呢。總之，Python大部分的安裝包都是很好安裝的。

分享到:

關鍵字: Python 哪些編程語言