每日一發小視頻
python要裝多少包,這個要取決於你用python做什麼工作了,基本上,在每一個應用方向都有專業的包。
python自帶了許多功能強大的包,比如:爬蟲包urllib,正則表達式包re,計算包collections,還有圖形包tkinter等等,這些包在你安裝python的時候就已經自動安裝了,當然,這都是基礎的包,我們日常用到的更多的是第三方包,因為第三方包功能更為強大。
作為數據挖掘人員,我先說一下日常用到的框架或者說模塊。
python本來自身是沒有很好的數據處理能力的,因為的他的基本數據結構就是那幾種,列表,字典,集合,元組等,無法使用到高維數組,更沒有提供矩陣運算的能力,但是!第三方庫numpy的出現,使python具備了處理數據和矩陣的能力,然後在此基礎上,出現更友好的處理數據的庫,scipy,pandas,這些都是基於numpy庫而來的,當然還有機器學習庫scikit-learn,這個模塊提供了強大的全面的機器學習算法,而且接口相對十分簡單,讓數學或者統計學工作者能很快上手。
所以,一個數據挖掘人員,日常使用就是這些:numpy,scipy,pandas,scikit-learn,還有數據可視化包matplotlib,這些日常處理數據,構建模型,結果可視化必備的工具。
但是這麼多包,他們之間又有相互依賴,一個個的安裝是個大問題,這裡推薦安裝anaconda,python的科學計算版本,自帶了上述的庫,十分方便,免除安裝的苦惱。
爬蟲是學習python有趣途徑,同樣有強大的框架
python自帶的urllib其實使用起來有點麻煩,推薦你使用requests庫,這是一個非常強大,使用方便的庫,而且有全面的中文文檔,網上爬數據爬圖片都不在話下。
還有更高級的庫-scrapy庫。
Scrapy是一個為了爬取網站數據,提取結構性數據而編寫的應用框架。 其可以應用在數據挖掘,信息處理或存儲歷史數據等一系列的程序中。
Scrapy 使用了 Twisted異步網絡庫來處理網絡通訊。整體架構大致如下
爬取網站數據,當然少不了正則模塊re,還有beautiful soup模塊
re模塊具有強大的處理字符串的能力,但是使用起來並不簡單,因為當你覺得可以使用正則表達式的時候,這本身就是一個問題,因為寫出一個正則表達式就是一個大問題。不過不用怕,在處理網站結構的數據時,有更強大的庫-beautiful soup
Beautiful Soup 是一個可以從HTML或XML文件中提取數據的Python庫,擁有完善的中文文檔,提供了種類繁多的屬性和方法供你選擇,讓你解析網站數據更加的得心應手!
web後端框架django,flask
python在web開發方面也是多面手,既有大而全的框架django,又有小而精的框架flask。
雖說在web開發方面有許多框架,但是最常用的還是這兩種,如果你想做中方面的工作,學好這兩個框架就夠用了,而且,目前的python後端開發的招聘需求多半是要求會這兩個框架。
python後端開發目前有不少公司在使用,比如,我們常見的知乎,豆瓣等都是
度學習和人工智能
說起深度學習,人工智能,當然少不了提到tensorflow,keras等流行的框架,而這都可以使用python進行友好的操作,如果你有志於人工智能,那麼你一定不能錯過python
分佈式計算框架spark
python無法進行分佈式計算,這是一個很大的缺陷,不過現在已經不是問題了,因為spark為python提供了極為友好的接口pyspark
有效的桌面gui庫-pyqt5
安裝很容易
PyQt5是一套綁定Qt5的應用程序框架。他在Python 2.x和3.x中都是可用的。PyQt5是作為一套Python模塊實現的。他已經超過620個類和6000個函數與方法。
除了以上模塊,python還有好多有用的模塊
比如:
中文分詞模塊jieba
圖片處理模塊PIL模塊
操作數據庫模塊pymysql、pymongo等
操作excel模塊xlrd,xlwt;
處理json數據的模塊json
基本上你需要的功能,python都有對應的模塊提供實現功能
愛數據的小司機
這麼說吧,缺啥補啥,用到什麼了你就安裝什麼,缺少什麼安裝包,你就安裝就行,不用非得把成千上萬個安裝包都安裝上,不科學也不現實。
就好像R語言一樣,安裝包超級多,你用什麼包的時候就去安裝即可,一下子在安裝R語言的時候,將包全部進行下載,系統盤都裝不下呢。總之,Python大部分的安裝包都是很好安裝的。