python數據分析（pandas入門）

2018-09-03 12:49:42 程序員小新人學習

1、pandas數據結構之DataFrame

DataFrame生成方式：1、從另一個DataFrame創建。2、從具有二維形狀的NumPy數組或數組的複合結構生成。3、使用Series創建。4、從CSV之類文件生成。下面介紹DataFrame的簡單用法：

a)：讀取文件

代碼：


from pandas.io.parsers import read_csv
df=read_csv("H:\Python\data\WHO.csv")
print "DataFrame:",df

運行結果（只截取部分）：


DataFrame: Country CountryID Continent \
0 Afghanistan 1 1 
1 Albania 2 2 
2 Algeria 3 3 
3 Andorra 4 2 
4 Angola 5 3

b)：得到形狀數據

代碼：


print "Shape:",df.shape #大小
print "Length:",len(df) #長度

結果：


Shape: (202, 358)
Length: 202

c)：得到列標題及類型數據

代碼：


print "Column Headers",df.columns #得到每列的標題
print "Data type",df.dtypes #得到每列數據的類型

結果（截取部分）


Column Headers Index([u'Country', u'CountryID', u'Continent',
 u'Adolescent fertility rate (%)', u'Adult literacy rate (%)',
 u'Gross national income per capita (PPP international $)',
 u'Net primary school enrolment ratio female (%)',
 u'Net primary school enrolment ratio male (%)',
 u'Population (in thousands) total',
 u'Population annual growth rate (%)',
 ...
 u'Total_CO2_emissions', u'Total_income', u'Total_reserves',
 u'Trade_balance_goods_and_services', u'Under_five_mortality_from_CME',
 u'Under_five_mortality_from_IHME', u'Under_five_mortality_rate',
 u'Urban_population', u'Urban_population_growth',
 u'Urban_population_pct_of_total'],
 dtype='object', length=358)
Data type Country object
CountryID int64
Continent int64
Adolescent fertility rate (%) float64
Adult literacy rate (%) float64
Gross national income per capita (PPP international $) float64
Net primary school enrolment ratio female (%) float64
Net primary school enrolment ratio male (%) float64

d)：索引

代碼：

print "Index:",df.index

結果：

Index: RangeIndex(start=0, stop=202, step=1)

e)：values，非數值數據標位nan

代碼：

print "Vales:",df.values

結果


Vales: [['Afghanistan' 1L 1L ..., 5740436.0 5.44 22.9]
 ['Albania' 2L 2L ..., 1431793.9 2.21 45.4]
 ['Algeria' 3L 3L ..., 20800000.0 2.61 63.3]
 ..., 
 ['Yemen' 200L 1L ..., 5759120.5 4.37 27.3]
 ['Zambia' 201L 3L ..., 4017411.0 1.95 35.0]
 ['Zimbabwe' 202L 3L ..., 4709965.0 1.9 35.9]]

2、pandas數據結構之Series

pandas的Series數據結構是由不同類型的元素組成的一維數組，該數據結構也具有標籤，創建方式有：由Python字典創建；由numpy數組創建；由單個標量值創建。

a)：類型。當選中DataFrame的一列時，得到的是一個Series型的數據。

代碼：


country_df=df["Country"]
print "Type df:",type(df)
print "Type country_df:",type(country_df)

結果：


Type df: 
Type country_df:

b)：屬性。pandas的Series數據結構不僅共享了DataFrame的一些屬性，還提供與名稱相關的一個屬性。

代碼：


print "Series Shape:",country_df.shape #獲取列的形狀
print "Series index:",country_df.index #獲取索引
print "Series values:",country_df.values #獲取該列的所有值
print "Series name:",country_df.name #獲取列名（標題）

結果：


Series Shape: (202L,)
Series index: RangeIndex(start=0, stop=202, step=1)
Series values: ['Afghanistan' 'Albania' 'Algeria' 'Andorra' 'Angola' 'Antigua and Barbuda'
 'Argentina' 'Armenia' 'Australia' 'Austria' 'Azerbaijan' 'Bahamas'
 'Bahrain' 'Bangladesh' 'Barbados' 'Belarus' 'Belgium' 'Belize' 'Benin'
 'Bermuda' 'Bhutan' 'Bolivia' 'Bosnia and Herzegovina' 'Botswana' 'Brazil'
 'Brunei Darussalam' 'Bulgaria' 'Burkina Faso' 'Burundi' 'Cambodia'
 'Cameroon' 'Canada' 'Cape Verde' 'Central African Republic' 'Chad' 'Chile'
 'China' 'Colombia' 'Comoros' 'Congo, Dem. Rep.' 'Congo, Rep.'
 'Cook Islands' 'Costa Rica' "Cote d'Ivoire" 'Croatia' 'Cuba' 'Cyprus'
 'Czech Republic' 'Denmark' 'Djibouti' 'Dominica' 'Dominican Republic'
 'Ecuador' 'Egypt' 'El Salvador' 'Equatorial Guinea' 'Eritrea' 'Estonia'
 'Ethiopia' 'Fiji' 'Finland' 'France' 'French Polynesia' 'Gabon' 'Gambia'
 'Georgia' 'Germany' 'Ghana' 'Greece' 'Grenada' 'Guatemala' 'Guinea'
 'Guinea-Bissau' 'Guyana' 'Haiti' 'Honduras' 'Hong Kong, China' 'Hungary'
 'Iceland' 'India' 'Indonesia' 'Iran (Islamic Republic of)' 'Iraq'
 'Ireland' 'Israel' 'Italy' 'Jamaica' 'Japan' 'Jordan' 'Kazakhstan' 'Kenya'
 'Kiribati' 'Korea, Dem. Rep.' 'Korea, Rep.' 'Kuwait' 'Kyrgyzstan'
 "Lao People's Democratic Republic" 'Latvia' 'Lebanon' 'Lesotho' 'Liberia'
 'Libyan Arab Jamahiriya' 'Lithuania' 'Luxembourg' 'Macao, China'
 'Macedonia' 'Madagascar' 'Malawi' 'Malaysia' 'Maldives' 'Mali' 'Malta' 

 'Marshall Islands' 'Mauritania' 'Mauritius' 'Mexico'
 'Micronesia (Federated States of)' 'Moldova' 'Monaco' 'Mongolia'
 'Montenegro' 'Morocco' 'Mozambique' 'Myanmar' 'Namibia' 'Nauru' 'Nepal'
 'Netherlands' 'Netherlands Antilles' 'New Caledonia' 'New Zealand'
 'Nicaragua' 'Niger' 'Nigeria' 'Niue' 'Norway' 'Oman' 'Pakistan' 'Palau'
 'Panama' 'Papua New Guinea' 'Paraguay' 'Peru' 'Philippines' 'Poland'
 'Portugal' 'Puerto Rico' 'Qatar' 'Romania' 'Russia' 'Rwanda'
 'Saint Kitts and Nevis' 'Saint Lucia' 'Saint Vincent and the Grenadines'
 'Samoa' 'San Marino' 'Sao Tome and Principe' 'Saudi Arabia' 'Senegal'
 'Serbia' 'Seychelles' 'Sierra Leone' 'Singapore' 'Slovakia' 'Slovenia'
 'Solomon Islands' 'Somalia' 'South Africa' 'Spain' 'Sri Lanka' 'Sudan'
 'Suriname' 'Swaziland' 'Sweden' 'Switzerland' 'Syria' 'Taiwan'
 'Tajikistan' 'Tanzania' 'Thailand' 'Timor-Leste' 'Togo' 'Tonga'
 'Trinidad and Tobago' 'Tunisia' 'Turkey' 'Turkmenistan' 'Tuvalu' 'Uganda'
 'Ukraine' 'United Arab Emirates' 'United Kingdom'
 'United States of America' 'Uruguay' 'Uzbekistan' 'Vanuatu' 'Venezuela'
 'Vietnam' 'West Bank and Gaza' 'Yemen' 'Zambia' 'Zimbabwe']
Series name: Country

c)：切片。

代碼：


print "Last 2 countries:",country_df[-2:] 
print "Last 2 countries type:",type(country_df[-2:])

結果：


Last 2 countries: 200 Zambia
201 Zimbabwe
Name: Country, dtype: object
Last 2 countries type:

3、利用Pandas查詢數據

a)：head()和tail()函數：

代碼：


sunspots=read_csv("H:\Python\data\sunspots.csv")
print "Head 2：",sunspots.head(2) #查看前兩行
print "Tail 2：",sunspots.tail(2) #查看後兩行

運行結果：


Head 2： Date Yearly Mean Total Sunspot Number
0 2016/12/31 39.8
1 2015/12/31 69.8
Tail 2： Date Yearly Mean Total Sunspot Number
316 1701-12-31 18.3
317 1700-12-31 8.3

b)：loc函數

代碼：


last_date=sunspots.index[-1]
print "Last value:\n",sunspots.loc[last_date]

運行結果：


last_date=sunspots.index[-1]
print "Last value:\n",sunspots.loc[last_date]

4、利用Pandas的DataFrame進行統計計算

pandas的DataFrame數據結構為我們提供了若干統計函數，下面給出部分方法及其簡要說明。

方法說明describe這個方法返回描述性統計信息count返回非NAN數據項的數量mad計算平均絕對偏差，級類似於標準差的一個有力統計工具median返回中位數，等價於第50百分位數的值min返回最小值max返回最大值mode返回眾數（mod），即一組數據中出現次數最多的變量值std返回表示離散度的標準差，即方差的平方根var返回方差skew返回偏差係數（skewness）,該係數表示的是數據分佈的對稱程度kurt這個方法將返回峰太係數，反映數據分佈曲線頂端尖峭或扁平程度代碼：

print "Describe:\n",sunspots.describe()
print "Non NaN observations:\n",sunspots.count()
print "MAD:\n",sunspots.mad()
print "Median:\n",sunspots.median()
print "Min:\n",sunspots.min()
print "Max:\n",sunspots.max()
print "Mode:\n",sunspots.mode()
print "Standard Deviation:\n",sunspots.std()
print "Variance:\n",sunspots.var()
print "Skewness:\n",sunspots.skew()
print "Kurtosis:\n",sunspots.kurt()

運行結果：


Describe:
 Yearly Mean Total Sunspot Number
count 318.000000
mean 79.193396
std 61.988788
min 0.000000
25% 24.950000
50% 66.250000
75% 116.025000
max 269.300000
Non NaN observations:
Date 318
Yearly Mean Total Sunspot Number 318
dtype: int64
MAD:
Yearly Mean Total Sunspot Number 50.925104
dtype: float64
Median:
Yearly Mean Total Sunspot Number 66.25
dtype: float64
Min:
Date 1700-12-31
Yearly Mean Total Sunspot Number 0
dtype: object
Max:
Date 2016/12/31
Yearly Mean Total Sunspot Number 269.3
dtype: object
Mode:
 Date Yearly Mean Total Sunspot Number
0 1985/12/31 18.3
Standard Deviation:
Yearly Mean Total Sunspot Number 61.988788 

dtype: float64
Variance:
Yearly Mean Total Sunspot Number 3842.60983
dtype: float64
Skewness:
Yearly Mean Total Sunspot Number 0.808551
dtype: float64
Kurtosis:
Yearly Mean Total Sunspot Number -0.130045
dtype: float64

5、利用pandas的DataFrame實現數據聚合

a)：為numpy的隨機數生成器指定種子，以確保重複運行程序時生成的數據不會走樣。該數據有4列：

1、Weather(一個字符串)；

2、Food(一個字符串)；

3、Price(一個隨機浮點數)；

4、Number(1~9之間的一個隨機整數)。

代碼：


import pandas as pd
from numpy.random import seed
from numpy.random import rand
from numpy.random import randint
import numpy as np
seed(42)
#random.rand(n),生成n個0到1間隨機數
#random.random_integers(low,high=None,size=None) 生成閉區間[low,high]上離散均勻分佈的整數值;若high=None，則取值區間變為[1,low]  

df=pd.DataFrame({'Weather':['cold','hot','cold','hot','cold','hot','cold'],'Food':['soup','soup','icecream','chocolate','icecream','icecream','soup'],
 'Price':10*rand(7),'Number':randint(1,9,size=(7,))})
print df

運行結果：


 Food Number Price Weather
0 soup 8 3.745401 cold
1 soup 5 9.507143 hot
2 icecream 4 7.319939 cold
3 chocolate 8 5.986585 hot
4 icecream 8 1.560186 cold
5 icecream 3 1.559945 hot
6 soup 6 0.580836 cold

b)：通過Weather列為數據分組，然後遍歷各組數據

代碼：


weather_group=df.groupby('Weather') #按天氣分組
i=0
for name,group in weather_group:
 i=i+1
 print "Group ",i,name
 print group

運行結果：


Group 1 cold
 Food Number Price Weather
0 soup 8 3.745401 cold
2 icecream 4 7.319939 cold
4 icecream 8 1.560186 cold
6 soup 6 0.580836 cold
Group 2 hot
 Food Number Price Weather
1 soup 5 9.507143 hot
3 chocolate 8 5.986585 hot
5 icecream 3 1.559945 hot

c)：變量Weather_group是一種特殊的pandas對象，可由groupby()生成。這個對象為我們提供了聚合函數，下面展示它的用法：

代碼：


print "Weather group first:\n",weather_group.first() #展示各組第一行內容
print "Weather group last:\n",weather_group.last() #展示各組最後一行內容
print "Weather group mean:\n",weather_group.mean() #計算各組均值

運行結果：

Weather group first:
 Food Number Price
Weather 
cold soup 8 3.745401
hot soup 5 9.507143
Weather group last:
 Food Number Price
Weather 
cold soup 6 0.580836
hot icecream 3 1.559945
Weather group mean:
 Number Price
Weather 
cold 6.500000 3.301591
hot 5.333333 5.684558

d)：恰如利用數據庫的查詢操作那樣，也可以針對多列進行分組。

然後就可以用groups屬性來了解所生成的數據組，以及每一組包含的行數：

代碼：


wf_group=df.groupby(['Weather','Food']) 

print "WF Group:\n",wf_group.groups

運行結果：


WF Group:
{('hot', 'chocolate'): Int64Index([3], dtype='int64'), ('cold', 'icecream'): Int64Index([2, 4], dtype='int64'), ('cold', 'soup'): Int64Index([0, 6], dtype='int64'), ('hot', 'soup'): Int64Index([1], dtype='int64'), ('hot', 'icecream'): Int64Index([5], dtype='int64')}

e)：通過agg方法，可以對數據組施加一系列的numpy函數：

代碼：

print "WF Aggregated:\n",wf_group.agg([np.mean,np.median])

運行結果：


WF Aggregated:
 Number Price 
 mean median mean median
Weather Food 
cold icecream 6 6 4.440063 4.440063
 soup 7 7 2.163119 2.163119
hot chocolate 8 8 5.986585 5.986585
 icecream 3 3 1.559945 1.559945
 soup 5 5 9.507143 9.507143

6、DataFrame的串聯與附加操作

a)：數據庫中的數據表有內部連接與外部連接兩種連接類型。pandas的DataFrame也有類似操作，也可以對數據進行串聯和附加。

函數concat()的作用是串聯DataFrame，如可以把一個由3行數據組成的DataFrame與其他行數據行串接，以便重建原DataFrame：

代碼：


print "df:3\n",df[:3]
print "Contact Back together:\n",pd.concat([df[:3],df[:3]])

運行結果：


df:3
 Food Number Price Weather
0 soup 8 3.745401 cold
1 soup 5 9.507143 hot
2 icecream 4 7.319939 cold
Contact Back together:
 Food Number Price Weather
0 soup 8 3.745401 cold
1 soup 5 9.507143 hot
2 icecream 4 7.319939 cold
0 soup 8 3.745401 cold
1 soup 5 9.507143 hot
2 icecream 4 7.319939 cold

b)：為了追加數據行，可以使用append函數：

代碼：

print "Appending rows:\n",df[3:].append(df[5:])

運行結果：


Appending rows:
 Food Number Price Weather
3 chocolate 8 5.986585 hot
4 icecream 8 1.560186 cold
5 icecream 3 1.559945 hot
6 soup 6 0.580836 cold
5 icecream 3 1.559945 hot
6 soup 6 0.580836 cold

7、連接DataFrames

a)、新建兩個CSV文件：dest.csv和tips.csv

代碼：


dests=pd.read_csv("H:\Python\data\dest.csv")
tips=pd.read_csv("H:\Python\data\\tips.csv")
print "dests:\n",dests
print "tips:\n",tips

運行結果：


dests:
 EmpNr Dest
0 5 The Hague
1 3 Amsterdam
2 9 Rotterdam
tips:
 EmpNr Amount
0 5 10.0
1 9 5.0
2 7 2.5

b)：pandas提供的merge函數或DataFrame的join函數實例方法都能實現類似數據庫的連接操作數功能。

pandas支持所有的這些連接類型，這裡僅介紹內部連接與完全外部連接。

用merge函數按照員工編號進行連接處理，代碼如下：

print "Merge() on key:\n",pd.merge(dests,tips,on='EmpNr')

運行結果：


Merge() on key:
 EmpNr Dest Amount
0 5 The Hague 10.0
1 9 Rotterdam 5.0

使用join方法執行連接操作，需要使用後綴來指示左操作對象和右操作對象：

print "Dest join() tips:\n",dests.join(tips,lsuffix='Dest',rsuffix='Tips')

運行結果：


Dest join() tips:
 EmpNrDest Dest EmpNrTips Amount
0 5 The Hague 5 10.0
1 3 Amsterdam 9 5.0
2 9 Rotterdam 7 2.5

用merge()執行內部連接和外部連接時，更顯示的方法如下所示：

代碼：


print "Inner join with merge():\n",pd.merge(dests,tips,how='inner') #內連接
print "Outer join with merge():\n",pd.merge(dests,tips,how='outer') #完全外部連接

運行結果：


Inner join with merge():
 EmpNr Dest Amount
0 5 The Hague 10.0
1 9 Rotterdam 5.0
Outer join with merge(): 

 EmpNr Dest Amount
0 5 The Hague 10.0
1 3 Amsterdam NaN
2 9 Rotterdam 5.0
3 7 NaN 2.5

8、處理缺失數據

a)：讀取數據。

代碼：


df=pd.read_csv("H:\Python\data\WHO.csv")
#print df.head()
df=df[['Country',df.columns[6]]][:2] #將原df的Country列和第6列組成新DataFrame，並取前兩行
print "New df:\n",df

運行結果:


New df:
 Country Net primary school enrolment ratio female (%)
0 Afghanistan NaN
1 Albania 93.0

b)：pandas會把缺失的數值標記為NaN，表示None。pandas的isnull()函數可以幫我們檢查缺失的數據。

代碼：


print "Null Values:\n",pd.isnull(df) #檢查每行缺失的數
print "Not Null Values:\n",pd.notnull(df) #檢查非缺失的數
print "Last Column Doubled:\n",2*df[df.columns[-1]] #NAN值乘以一個數後還是NAN
print "Last Column plus NaN:\n",df[df.columns[-1]]+np.nan #非NAN值加上NAN後變為了NAN 

print "Zero filled:\n",df.fillna(0) #使用0替換NAN

運行結果：


Null Values:
 Country Net primary school enrolment ratio female (%)
0 False True
1 False False
Not Null Values:
 Country Net primary school enrolment ratio female (%)
0 True False
1 True True
Last Column Doubled:
0 NaN
1 186.0
Name: Net primary school enrolment ratio female (%), dtype: float64
Last Column plus NaN:
0 NaN
1 NaN
Name: Net primary school enrolment ratio female (%), dtype: float64
Zero filled:
 Country Net primary school enrolment ratio female (%)
0 Afghanistan 0.0
1 Albania 93.0

9、處理日期數據

a)：設定從1900年1月1日開始為期42天的時間範圍。

代碼：

print "Date range:\n",pd.date_range('1/1/1900',periods=42,freq='D') #42表示天數，D表示使用日頻率。如果periods='W',表示42周

運行結果：


Date range:
DatetimeIndex(['1900-01-07', '1900-01-14', '1900-01-21', '1900-01-28', 

 '1900-02-04', '1900-02-11', '1900-02-18', '1900-02-25',
 '1900-03-04', '1900-03-11', '1900-03-18', '1900-03-25',
 '1900-04-01', '1900-04-08', '1900-04-15', '1900-04-22',
 '1900-04-29', '1900-05-06', '1900-05-13', '1900-05-20',
 '1900-05-27', '1900-06-03', '1900-06-10', '1900-06-17',
 '1900-06-24', '1900-07-01', '1900-07-08', '1900-07-15',
 '1900-07-22', '1900-07-29', '1900-08-05', '1900-08-12',
 '1900-08-19', '1900-08-26', '1900-09-02', '1900-09-09',
 '1900-09-16', '1900-09-23', '1900-09-30', '1900-10-07',
 '1900-10-14', '1900-10-21'],
 dtype='datetime64[ns]', freq='W-SUN')

b)：在pandas中，日期區間是有限制的。pandas的時間戳基於numpy datetime64類型，以納秒為單位，並且用一個64位整數來表示具體數值。因此，日期有效的時間戳介於1677年至2262年。當然，這些年份也不是所有日期都是有效的。這個時間範圍的精確中點是1970年1月1日。這樣，1677年1月1日就無法用pandas時間戳定義，而1677年9月30日就可以，下面用代碼說明：

代碼：


import pandas as pd
import sys
try:
 print "Date range:\n",pd.date_range('1/1/1677',periods=4,frep='D')
except:
 etype,value,_=sys.exc_info() #獲得錯誤類型，錯誤值
 print "Error encountered:\n",etype,value #打印

運行結果:


Date range:
Error encountered:
 Out of bounds nanosecond timestamp: 1677-01-01 00:00:00

b）：使用pandas的Dateoffset函數計算允許的日期範圍：

代碼：


offset=pd.DateOffset(seconds=2**63/10**9)
mid=pd.to_datetime('1/1/1970')
print "Start valid range:\n",mid-offset
print "End valid range:\n",mid+offset

運行結果：


Start valid range:
1677-09-21 00:12:44
End valid range:
2262-04-11 23:47:16

c):pandas可以把一串字符串轉化成日期數據：

代碼：

print "With format:\n",pd.to_datetime(['1901113','19031230'],format='%Y%m%d')

運行結果：


With format:
DatetimeIndex(['1901-11-03', '1903-12-30'], dtype='datetime64[ns]', freq=None)

d)：如果一個字符串明顯不是日期，無法轉化。可以使用參數coerce設置為True強制轉化：

代碼：


print "Illegal date:\n",pd.to_datetime(['1901-11-13','not a date']) #第二個字符串無法轉換，運行報錯 

print "Illegal date:\n",pd.to_datetime(['1901-11-13','not a date'],coerce=True) #強制轉化，得到非時間數NAT

運行結果：


Illegal date:
DatetimeIndex(['1901-11-13', 'NaT'], dtype='datetime64[ns]', freq=None)

10、數據透析表

a）：數據透析表可以從一個平面文件中指定的行和列中聚合數據，這種聚合操作可以是求和、求平均值，求標準差等運算。


import pandas as pd
from numpy.random import seed
from numpy.random import rand
from numpy.random import randint 
import numpy as np
 
seed(42)
N=7
df=pd.DataFrame({'Weather':['cold','hot','cold','hot','cold','hot','cold'],'Food':['soup','soup','icecream','chocolate','icecream','icecream','soup'],
 'Price':10*rand(7),'Number':randint(1,9,size=(7,))})
print "DataFrame:\n",df
print pd.pivot_table(df,index='Food',aggfunc=np.sum) #計算各類型Food的統計值

運行結果：


DataFrame:
 Food Number Price Weather
0 soup 8 3.745401 cold
1 soup 5 9.507143 hot
2 icecream 4 7.319939 cold
3 chocolate 8 5.986585 hot
4 icecream 8 1.560186 cold 

5 icecream 3 1.559945 hot
6 soup 6 0.580836 cold
 Number Price
Food 
chocolate 8 5.986585
icecream 15 10.440071
soup 19 13.833380

分享到:

閱讀更多 程序員小新人學習 的文章

關鍵字: 贊比亞冰淇淋數據結構

從零開始學Python【四】--pandas(序列部分)

pandas 數據類型轉換

開源教程《Joyful-Pandas》發佈（數據分析必讀）

Pandas Groupby —解釋

大數據Join指南-Python，SQL，Pandas，Spark，Dask

NumPy、pandas、Matplotlib…8個Python庫從安裝到應用（附代碼）

pandas 之 groupby

Pandas分組聚合

Pandas數據整合

Pandas索引+增刪改查

02.28 智聯Python相關職位的數據分析及可視化-Pandas&Matplotlib篇

01.18 Pandas 數據處理三板斧，你會幾板？

Pandas 1.0.0rc發佈：增加markdown格式的輸出

# Python 3 # Python 3字典Dictionary（2）

# Python 3 # Python 3字典Dictionary（1）

# Python 3 # Python 3運算符（4）

# Python 3 # Python 3基本數據類型（3）

12.21 python lambda表達式簡單用法

還在手動導入 pandas？你太 out 了

12.08 秒開 100GB 數據！甩了 Pandas 幾條街啊

別找了，這是 Pandas 最詳細教程了

python :中文大寫轉阿拉伯數字（金額）

python str和bytes的區別

簡直了，竟然只需十分鐘就能完全掌握Python pandas

python基礎知識：Pandas DataFrame中的tuple元素遍歷的實現

數據處理必看：如何讓你的 pandas 循環加快 71803 倍

Python 的四種共享傳參詳解

python 音頻處理

python 可變對象和不可變對象

Python 程序運行時間計時

python 字典底層實現原理

Pandas 基本介紹

用Python做數據處理需要知道的：6個使效率倍增的 Pandas 技巧

用 Python Pandas 處理億級數據

python pandas 數據分組計數統計

09.18 使用scikit-learn和PySpark Pandas UDF進行大規模預測

python數據分析實用技能：Pandas 透視表(pivot

Pandas 初學者代碼優化指南

06.17 Python 數據類型轉換

06.09 Python 異常處理

pip install pandas

python-with語法

05.27 python-with語法

python-as語法

05.27 python-as語法

python數據分析工具——Pandas、StatsModels、Scikit-Learn

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

python數據分析（pandas入門）

1、pandas數據結構之DataFrame

2、pandas數據結構之Series

3、利用Pandas查詢數據

4、利用Pandas的DataFrame進行統計計算

5、利用pandas的DataFrame實現數據聚合

6、DataFrame的串聯與附加操作

8、處理缺失數據

9、處理日期數據

10、數據透析表

相關文章:

從零開始學Python【四】--pandas(序列部分)

pandas 數據類型轉換

開源教程《Joyful-Pandas》發佈（數據分析必讀）

Pandas Groupby —解釋

大數據Join指南-Python，SQL，Pandas，Spark，Dask

NumPy、pandas、Matplotlib…8個Python庫從安裝到應用（附代碼）

pandas 之 groupby

Pandas分組聚合

Pandas數據整合

Pandas索引+增刪改查

02.28 智聯Python相關職位的數據分析及可視化-Pandas&Matplotlib篇

01.18 Pandas 數據處理三板斧，你會幾板？

Pandas 1.0.0rc發佈：增加markdown格式的輸出

# Python 3 # Python 3字典Dictionary（2）

# Python 3 # Python 3字典Dictionary（1）

# Python 3 # Python 3運算符（4）

# Python 3 # Python 3基本數據類型（3）

12.21 python lambda表達式簡單用法

還在手動導入 pandas？你太 out 了

12.08 秒開 100GB 數據！甩了 Pandas 幾條街啊

別找了，這是 Pandas 最詳細教程了

python :中文大寫轉阿拉伯數字（金額）

python str和bytes的區別

簡直了，竟然只需十分鐘就能完全掌握Python pandas

python基礎知識：Pandas DataFrame中的tuple元素遍歷的實現

數據處理必看：如何讓你的 pandas 循環加快 71803 倍

Python 的四種共享傳參詳解

python 音頻處理

python 可變對象和不可變對象

Python 程序運行時間計時

python 字典底層實現原理

Pandas 基本介紹

用Python做數據處理需要知道的：6個使效率倍增的 Pandas 技巧

用 Python Pandas 處理億級數據

python pandas 數據分組計數統計

09.18 使用scikit-learn和PySpark Pandas UDF進行大規模預測

python數據分析實用技能：Pandas 透視表(pivot

Pandas 初學者代碼優化指南

06.17 Python 數據類型轉換

06.09 Python 異常處理

pip install pandas

python-with語法

05.27 python-with語法

python-as語法

05.27 python-as語法

python數據分析工具——Pandas、StatsModels、Scikit-Learn

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪