Python即將納入全國性高考,你還一無所知?

Python即將納入全國性高考,你還一無所知?

Python爆紅背後的原因是什麼?為什麼身邊的小夥伴都開始學習Python?怎樣零基礎開始學習這門語言?學習難點在哪裡?DT財經特邀紐約數據科學學院講師張澤宇,為你們一一解答這些問題。

▍火爆的Python語言

國外的StackOverflow(DT君注:StackOverflow是一個與程序相關的IT技術問答網站。用戶可以在網站免費提交問題,瀏覽問題,索引相關內容)網站上,Python已經是增長速度最快的語言,並且將可能在2020年成為最流行的語言。

Python即將納入全國性高考,你還一無所知?

最近Python從Python2轉型到Python3,很多小夥伴因此遇到問題,這可能是StackOverflow網站中提問數激增的原因之一。

而在Github(DT君注:GitHub是一個面向開源及私有軟件項目的託管平臺)中,在2014年JavaScript是目前排名第一的語言,Java排名第二,Python排名第三,而隨著Python的流行,現在Python的排名上升到了第二位。

Python即將納入全國性高考,你還一無所知?

JavaScript是目前網頁開發的首選語言,有非常多有用的框架,但是更新非常快,不利於新手學習。另一方面,Python也從Python2更新到了Python3。因此兩種語言都各有優劣勢。

去年有則新聞引起了關注,其中提到Python語言將被加入高考科目,可見這門語言被越來越重視。

在國內,數據分析的工作需求量非常大,Python作為數據分析的頭號語言,因此也越來越受歡迎。國內很多數據都是雜亂無章的,比如醫學分析報告,由很多病患的化驗結果拼接在一起,如果需要從中提取有用的數據,就需要用Python去處理。

▍Python學習中的難點在哪裡?零基礎怎麼破?

Python是“入門易,精通難”的語言。跟C++等語言比起來,Python的語言非常精簡,有時候解決一個問題需要十行C++代碼,而Python只需要一行。

那麼零基礎學員如何入門?澤宇老師推薦了兩個預習課程:在Codecademy網站和Github網站上完成基礎課程後,再參加紐約數據科學院的訓練營會更加順利。(DT君注:Codecademy,是一家國外在線學習編程知識的網站)Codecademy網站是非常適合新手來練習,在這個網站可以邊學邊練,網站會反饋代碼的正誤。

在美國有兩個學習代碼的理念:Learn by coding、Keep your hands dirty。因此,想要學會Python,一定要親自動手敲代碼。為了保證學習的效果,訓練營要求學員先在Codecademy上通過Python相關的練習,才能開始參與訓練營。

另外,在GitHub網站上還有一個目錄“awesome-python”,裡面有很多教程,包括數據分析、數據可視化、機器學習、自然語言處理和網絡開發等,涵蓋了Python可以應用的所有領域。

澤宇老師再額外給大家分享一個小技巧:在Github上搜索“awesome-想學的語言”,如“awesome-java”,就可以找到對應的目錄。

聽老師講再多,最實在的還是自己去完成一個項目。經驗都是一個坑一個坑踩出來的,在訓練營熬得每一個通宵都會有回報。

▍訓練營課程亮點在哪裡?

英文原版課件翻譯

訓練營的課件用的是紐約教育局認證的英文原版課件,授課用中文。用英文原版課件的原因有兩個:其一,Python代碼要求用全英文;其二,學員在StackOverflow和Github上提問時,只有熟悉Python的英文名詞,才能使問題被人理解。

純乾貨,不廢話

澤宇老師的教學風格偏向於“相聲流”,類似早年非常流行的新東方英語羅永浩老師的教學風格,非常注重跟學生互動。他打趣說心中理想的授課方式是直播,學員可以隨時發彈幕提問,還能給他雙擊“666”和刷火箭。

訓練營的所有課程都是對項目有幫助的,不浪費學員寶貴的時間。學員還可以到紐約數據科學院的網站上瀏覽往期學員做的幾百個項目,滿滿都是乾貨。

有同學可能會問,課程亮點這麼多,是不是上完就一定能找到工作?給大家講個小段子:當年羅永浩老師在開老羅英語培訓的時候,演講說國內英語培訓有三大流派:第一個是“神奇派”,比如神奇速記,英語神奇記憶千法;第二個是“N天搞定派”,十七天搞定GRE單詞,17天突破託福作文;第三個流派是“不不不派”,學英語單詞不用背,英語單詞不再背。但是紐約數據科學院不會做這種“十天搞定Python”的課程。

有一個訓練營的畢業生給出了這樣的評價:“訓練營就像一個放大鏡,比如說一個十倍的放大鏡,你投入一塊錢得到十塊錢,投入十塊錢得到一百塊。”所以學員投入的時間以及精力越多,自然而然得到的回報也會越多。

往期學員項目

澤宇老師為大家分享了一些往期學員的項目。

其中,學員抓取了招聘網站Glassdoor中美國各大城市的招聘信息,然後進行簡單的薪水分析,可以看到加州和聖何塞的薪水比紐約還要高。但是加州的稅率以及房租也會比紐約高,所以最後到手的工資不一定比紐約的高。在這樣的案例中,老師會建議學生再抓取一些生活成本、稅率等其他方面的統計數據,綜合分析出到底哪個城市最適合數據科學家找工作。

Python即將納入全國性高考,你還一無所知?

在這個項目中,該同學還做了詞頻分析。可以看出各大科技公司的主打產品和語言,比如蘋果公司的關鍵詞是Siri和機器學習,亞馬遜的關鍵詞是AWS雲計算服務,臉書的主打語言是PHP,谷歌主打Cloud和安卓,微軟主打Azure。

Python即將納入全國性高考,你還一無所知?

有同學可能會問:到公司工作的時候會用到網絡爬蟲嗎?公司裡面不是有內部數據和現成的數據嗎?其實好數據是要花很大價錢去買的。

舉一個具體例子,訓練營上一期和美國的最大的鎖具製造企業Masterlock合作,他們提供數據和要求,訓練營的學生分組給他們做一些類似於諮詢的服務,這樣學生在畢業之前可以接觸到大公司的真實數據,瞭解到大公司對數據科學工作的要求。

Masterlock非常關心自己在各個電商的評價,希望訓練營的學生做一個爬蟲軟件,每天定時從亞馬遜上抓取過去24小時內的新評論。對抓取到的新評論,要先做數據清理,接著運用一些自然語言處理的技術來處理,比如深度學習裡面的遞歸神經網絡技術。

最後,生成報告告訴Masterlock,這條評價是關於什麼的,比如說鎖的顏色、安全性等。用爬蟲軟件代替人工來讀評論,這就是用數據科學和機器學習改變公司處理數據的方式。

▍Python更高級的應用

學會用Python做數據分析之後,可以參加Kaggle數據分析競賽。(DT君注:Kaggle是一個數據分析的競賽平臺:企業或者研究者可以將數據、問題描述、期望的指標發佈到Kaggle上,以競賽的形式向廣大的數據科學家徵集解決方案)

Python即將納入全國性高考,你還一無所知?

比如澤宇老師正在參加桑坦德銀行的一個客戶價值預測比賽,它的獎金有6萬美金。這個比賽會解決一個實際問題,其中不會把敏感數據的含義公佈出來,這樣就不會造成數據洩露問題。

Kaggle最近前段時間被google收購了。現在網站上每年會有將近上百比賽推出,有的是預測兩個商品的相似度,或者預測哪條生產線會有更大的概率出現事故。比賽運用到的數據包括數字、文字和圖片相關的數據。現在有很多中國學生參加上面的比賽,可以在排行榜上看到很多中文的ID。

紐約數據訓練營的學員在Kaggle的比賽中獲得過很好的成績,拿到過不少銀牌和銅牌,澤宇老師也拿到過一些金牌和銀牌。在Kaggle上拿獎會在以後找工作時有幫助,參與的項目在簡歷上是一個有利的加分項。

Python還可以應用在圖像識別上。比如下圖中識別圖片中是狗還是貓。圖像識別更進一步的應用是無人駕駛汽車。

Python即將納入全國性高考,你還一無所知?

上層建築一定要有底層基礎,把基礎打牢了之後才有能力去挑戰更高難度的任務。

注:以上內容根據張澤宇在數據俠線上實驗室的演講實錄整理。圖片來自其現場PPT。本文僅為作者觀點,不代表DT財經立場

編輯 | 陳靜 [email protected]

題圖 | 站酷海洛

期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後臺回覆“數據社群”,可申請加入DT數據社群。

▍數據俠門派

張澤宇,紐約數據科學學院數據科學家,主要負責紐約數據科學院訓練營的Python、機器學習、深度學習課程教學。上海交通大學工程專業學士,紐約大學電子工程專業碩士。

Python即將納入全國性高考,你還一無所知?

Python即將納入全國性高考,你還一無所知?


分享到:


相關文章: