2020-02-09 12:25:00 讀芯術

全文共2252字，預計學習時長

7分鐘

注意：Pandas 1.0.0rc已於1月9日發佈，先前的版本為0.25。

Pandas首個全新主要發行版本包含許多重要功能：更完善的數據框自動彙總、更全面的輸出格式、全新的數據類型以及文檔站點。

在全新的文檔站點上，可以找到完整的發行說明，但小芯認為，技術含量較低的概述也會有所幫助。

用戶可以使用 pip升級Pandas，以便使用其新版本。在撰寫本文時，Pandas1.0仍然是候選版本，這意味著要安裝Pandas1.0需要明確指定其版本。

<code>pip install --upgradepandas==1.0.0rc0/<code>

當然，更新可能會破壞某些代碼，因為這是主要版本的發佈，因此請務必小心！

此版本的Pandas不再支持Python 2。運行Pandas 1.0+至少需要Python 3.6+，因此請確保使用合適版本的pip 和python。

<code>$ pip --version/<code>

<code>pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)$ python--version/<code>

<code>Python 3.7.5/<code>

用戶可以確認一切正常，並且Pandas使用的是正確版本。

<code>>>> import pandas as pd/<code>

<code>>>> pd.__version__/<code>

<code>1.0.0rc0/<code>

使用DataFrame.info更好的自動彙總

筆者最喜歡的新功能是優化之後的DataFrame.info法。現在，它使用了更具可讀性的格式，從而使數據探索過程更加容易。

<code>>>> df = pd.DataFrame({/<code>

<code>...: 'A': [1,2,3],/<code>

<code>...: 'B': ["goodbye","cruel", "world"],/<code>

<code>...: 'C': [False, True, False]/<code>

<code>...:})/<code>

<code>>>> df.info()/<code>

<code><class>/<code>

<code>RangeIndex: 3 entries, 0 to 2/<code>

<code>Data columns (total 3 columns):/<code>

<code># Column Non-Null Count Dtype/<code>

<code>--- ------ -------------- -----/<code>

<code>0 A 3 non-null int64/<code>

<code>1 B 3 non-null object/<code>

<code>2 C 3 non-null object/<code>

<code>dtypes: int64(1), object(2)/<code>

<code>memory usage: 200.0+ bytes/<code>

Markdown表的輸出格式

其次，筆者最喜歡的功能是使用新的 DataFrame.to_markdown 法將數據幀導出到Markdown表中。

<code>>>> df.to_markdown()/<code>

<code>| | A | B | C |/<code>

<code>|---:|----:|:--------|:------|/<code>

<code>| 0 | 1 | goodbye | False |/<code>

<code>| 1 | 2 | cruel | True |/<code>

<code>| 2 | 3 | world | False |/<code>

這樣一來，通過github gists在Medium等地方顯示錶格更加便捷。

booleans and strings的新數據類型

Pandas1.0還為booleans and strings引入了實驗數據類型。

由於這些更改是實驗性的，數據類型的API可能會稍有更改，因此應謹慎使用。但是Pandas建議在合理的地方使用這些數據類型，將來的版本將完善諸如regex匹配之類的特定於類型的操作性能。

默認情況下，Pandas不會自動將數據強制轉換為這些類型。但是，如果明確指示Pandas，仍然可以使用它們。

<code>>>> B =pd.Series(["goodbye", "cruel", "world"],dtype="string")/<code>

<code>>>> C = pd.Series([False, True, False], dtype="bool")/<code>

<code>>>> df.B = B, df.C = C/<code>

<code>>>> df.info()/<code>

<code><class>/<code>

<code>RangeIndex: 3 entries, 0 to 2/<code>

<code>Data columns (total 3 columns):/<code>

<code># Column Non-Null Count Dtype/<code>

<code>--- ------ -------------- -----/<code>

<code>0 A 3 non-null int64/<code>

<code>1 B 3 non-null string/<code>

<code>2 C 3 non-null bool/<code>

<code>dtypes: int64(1), object(1), string(1)/<code>

<code>memory usage: 200.0+ bytes/<code>

注意Dtype列現在如何反應新類型的string和bool。

新字符串dtype最實用的優勢在於，可以從DataFrame中選擇string列。這樣可以更快地僅對數據集的文本成分進行分析。

<code>df.select_dtypes("string")/<code>

以前，只能通過顯式使用其名稱來選擇string類型列。

從今天開始，掌握Pandas 1.0的主要功能，全新優化開啟使用吧~

我們一起分享AI學習與發展的乾貨

分享到:

閱讀更多 讀芯術 的文章

關鍵字: 這些 GitHub 功能

這些Pandas1.0主要功能，你掌握了嗎？

使用DataFrame.info更好的自動彙總

Markdown表的輸出格式

booleans and strings的新數據類型

相關文章:

這些Pandas1.0主要功能，你掌握了嗎？

使用DataFrame.info更好的自動彙總

Markdown表的輸出格式

booleans and strings的新數據類型

相關文章:

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

為什麼馬鈴薯不宜過早過遲播種？

疫情愈發嚴重，原油為何反而大漲？

生菜球很好吃，怎麼種植才能高產呢？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？ ？

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

書友們展示一下自我感覺發揮較好的作品，一起學習？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？