描述統計(descriptive statistics):研究數據收集、處理和描述的統計學方法
統計學的基礎概念
統計學本質是收集、處理、分析、解釋數據,並從中得出結論的科學。
數據類型不同維度分為不同數據:
測量尺度:分類數據、順序數據、數值型數據;
收集方法:觀測數據、實驗數據;
時間狀況:截面數據、時間序列數據。
數據分析的方法可分為描述統計和推斷統計。
數量變量分為:
離散——度量『可數事物』的多少,離散型變量則是通過計數方式取得的,即是對所要統計的對象進行計數(計量),增長量非固定的。比如人數,客戶數,生產產品數。
連續——度量『不可數事物』的多少,連續型變量是一直疊加上去的,增長量可以劃分為固定的單位。比如身高,體重,重量。
(這個世界到底是離散的還是連續的?)
分類變量如“行業”,其變量值可以為“零售業”、“旅遊業”、“汽車製造業”;
順序變量如“產品等級”,其變量值可以位“一等品”、“二等品”、“次品”。
分類變量與順序變量均可稱為定性變量、屬性變量。
數據的描述——數值方法
度量值來自於總體與樣本的統計量。
度量值分為單變量與雙變量,統計方法有:
單變量——中心位置、變異程度、分佈形態、相對位置;
雙變量——線性關係
中心位置的度量方法
變異程度
分佈形態
線性關係
探索數據分析
在excel 數據---“數據分析---描述統計 中能得到所有指標值。
數據的概括性度量
集中趨勢:平均數(算數平均數、幾何平均數、調和平均數、算術-幾何平均數、平均數不等式)、眾數、中位數等。
離散程度:全距、內距、平均差、標準誤、離散係數等。
分佈:偏態係數、峰度係數,反映數據偏離正態分佈的程度。
具體如圖總結:
數據的圖表展示
圖表應簡潔、合理的表達統計目的,不應在圖形的修飾上花費太多時間。在繪製圖形時,應避免一切不必要的裝飾,注重圖形所要表達的信息,圖形產生的視覺效果應與數據所體現的事物特徵一致,不得歪曲數據。
圖表一般定義與約束
統計表左右兩邊不封口,列標題之間在必要時可用豎線分開,而行標題通常不必用橫線分開;表中數據一般是右對齊,有小數點時小數點對齊,小數點位數統一,對於沒有數字的單元,一般用“—”表示,表中不應出現空白單元格。
總結
閱讀更多 槓精君 的文章