Cp、Cpk、Pp、Ppk,這一文說清楚了

1. 背景

Cp, Cpk, Pp 和 Ppk這幾個概念在工業製造領域的應用已經很普遍了,但是這些概念往往被混淆。網上的解釋各執其詞,而且錯誤百出(如下圖)。

Cp、Cpk、Pp、Ppk,這一文說清楚了

就連國外網站上的討論也是眾說不一⑥。當這些概念用中文解釋時,那就更復雜了。比如這些概念裡共有的"P" 是一個簡單的英語詞"process",可被翻譯成什麼的都有,比如"過程,工藝,工序,製程 …"等等。可想而知加了其他詞以後就更復雜了。為了方便起見,以下process均採用"過程"。

筆者2003年在學校裡就學習了這些概念,而且在之後的十幾年的工作中也不斷地在應用這些概念。但始終覺得沒有完全理解其本質區別。多年下來一直都是在照貓畫虎,套公式,得出結果,做出判斷,完事。更有甚者,現在有現成的計算機軟件,點一點鼠標就可以得到結果。更不用知道其後臺是如何計算的了。一般來說,能做到此,也就可以了。所以下面的解析是為有意願深入瞭解這些概念的差別的讀者準備的。

Cp, Cpk, Pp 和 Ppk都是用來體現過程能力的指標①②,它們是用來測量過程能力的指數(process capability index),不是過程能力本身。很多人只知道計算這些指數,卻並不知道過程的固有能力到底是什麼。那什麼是過程能力(process capability)?

2. 過程能力的定義

過程能力是指過程本身在沒有外因干預、沒有漂移(drift)(即統計學意義上可控under statistical control)的情況下其產出品的均一程度 (uniformity of product)②③。不難理解,我們不可能直接測量過程本身,而只能通過測量其產出品的某個特性來體現其能力③。通常用被測量的特性的離散程度, 即標準方差, (西格瑪),來表示過程能力。而且過程能力被量化為 ,即其總寬度為6個西格瑪。其中 是過程的均值(mean), 是過程的標準方差(西格瑪)。

例如A過程的西格瑪=2,其過程能力=6*2=12。

B過程的西格瑪=2.5,其過程能力=6*2.5=15。那麼問題來啦:A過程和B過程那個好呢?

答案是:視情況而定(it depends)。為什麼?因為沒有判斷標準。


3. 衡量過程能力的指標的定義與計算公式

也許你已經注意到過程能力的定義與產品的可接受標準(specifications)無關。可是拋開產品的可接受標準,單純地講過程能力,又毫無意義。這就是為什麼人們要引入“過程能力的指標(Cp, Cpk, Pp 和 Ppk )”這些概念。

Cp, Cpk, Pp 和 Ppk這些指數是過程能力和可接受標準比較的結果,也被稱為過程能力比率(process capability ratio)③。筆者更傾向於使用過程能力比率,因為它直觀。另外這些概念的計算都引入了標準方差或西格瑪,因此它們都是統計學意義上的概念,也正是如此它們都沒有單位。

有趣的是,權威書籍中均沒有體現這幾個符號(Cp, Cpk, Pp ,Ppk)所代表的英文詞。而在這個英文網站上⑥:https://www.isixsigma.com/tools-templates/capability-indices-process-capability/ 有以下的定義:

Cp、Cpk、Pp、Ppk,這一文說清楚了

這些定義很顯然是有問題的,因為這四個符號都是“index”或“ratio”。筆者認為它們的定義是這樣的:

Cp= Process Capability Ratio 可被譯為“過程能力指數”

Cpk= Process Capability K Ratio 可被譯為“過程能力K指數”

Pp= Process Performance Ratio 可被譯為“過程績效指數”

Ppk= Process Performance K Ratio 可被譯為“過程績效K指數”

注:據有人說 這裡的‘k’ 是 ‘centralizing facteur’⑥,可能是法語,即“居中因子”。

據此,Cp和Cpk被稱為過程能力指數;而Pp和Ppk則被稱為過程績效指數。我們權且將過程能力指數和績效指數統稱為衡量過程能力的指標。

以上是關於Cp, Cpk, Pp 和 Ppk這些指標的定義。下面我們討論這些指標的計算方法。

Cp、Cpk、Pp、Ppk,這一文說清楚了

Cp、Cpk、Pp、Ppk,這一文說清楚了

瞭解了這些概念和計算公式,下面讓我們看看這些指數的共同點和區別。

4. Cp, Cpk, Pp 和 Ppk的異同點

4.1 Cp, Cpk, Pp 和 Ppk的共同點

Cp, Cpk, Pp 和 Ppk都是用來測量過程能力的指標。它們的共同點是:

• 都被用來表示過程能夠生產出達到可接受標準的產品的程度或能力

• 都被用來表示過程的產出品的離散程度和可接受標準的比率

• 它們的值越大,過程越能夠更好地生產出達到可接受標準的產品

當然它們也各有區別。

4.2. 有k指數(Cpk和Ppk)和沒k指數(Cp和Pp)的區別

首先是有k指數(Cpk和Ppk)和沒k指數(Cp和Pp)的區別:沒k指數(Cp和Pp)只顯示過程的產出品的離散程度和可接受標準的關係;而有k指數(Cpk和Ppk)除了顯示過程的產出品的離散程度和可接受標準的關係外,還關注過程的產出品的均值是否偏離可接受標準的中間值。其數學關係是:有k指數永遠不大於沒k指數,即:

• Cpk≤Cp(當過程的產出品的均值和可接受標準的中間值重疊時,Cpk=Cp, 否則Cpk

• Ppk≤Pp(當過程的產出品的均值和可接受標準的中間值重疊時,Ppk=Pp, 否則Ppk

我在工作中發現沒K指數(Cp和Pp)應用得較少,估計是因為很少有過程的產出品的均值正好與可接受標準的中間值重疊。但其實這是不對的:有k指數(Cpk和Ppk)和沒k指數(Cp和Pp)應該一起使用才能準確體現過程的能力①,詳情其後討論。現在讓我們先看看過程能力指數(Cp和Cpk)和過程績效指數(Pp和Ppk)的區別。

4.3 過程能力指數(Cp和Cpk)和過程績效指數(Pp和Ppk)的區別

過程能力指數(Cp和Cpk)和過程績效指數(Pp和Ppk)的區別,即Cp和Pp的區別,Cpk和Ppk的區別。

Cp、Cpk、Pp、Ppk,這一文說清楚了

其中 R-bar是通過將被考量的過程在某一時段(考察區間)的產出品的觀察樣本的某個性能的數值製成過程控制圖(Control Chart)來得到的;而d2 則是一個統計學常數,與過程控制圖的樣本亞組(subgroup)的樣品個數有關,其值可以參考下表⑤。

Cp、Cpk、Pp、Ppk,這一文說清楚了

d2的值可以通過很多書籍查到①②③④,但常用的就是n小於10的值。其實超過5的話數據量就很大了。

現在我們瞭解了S和 西格瑪的區別,那麼我們是不是就理解了Cpk和Ppk的區別了呢?似乎沒那麼簡單。相信大家還是弄不清它們的本質區別。下面我們用一個很容易理解的例子來說明一下它們的計算。

假設公司有班車接員工上班, 我們讓坐班車的同事記錄班車第一個站到公司的時間(分鐘),觀測了30天,得到下面表格的數據。

Cp、Cpk、Pp、Ppk,這一文說清楚了

使用標準差公式計算,得出S=11.6。

假設公司要求司機每天要在從第一站到公司的時間要保持在55分鐘到70分鐘之間(時間太短司機可能超速,不安全,時間太長班車會晚點),則LSL=55,USL=70。套用以上的公式可以得到以下Pp和Ppk的結果。

Cp、Cpk、Pp、Ppk,這一文說清楚了

Cp、Cpk、Pp、Ppk,這一文說清楚了

Cp、Cpk、Pp、Ppk,這一文說清楚了

根據這個控制圖,得到 R-bar=12.7。運用上面的公式 可以得到 西格瑪=12.7/1.128=11.259。再運用Cp和Cpk的公式得到:

Cp = 0.222, Cpk = 0.138

綜上我們可以得到以下的結果:

Pp = 0.216 Ppk = 0.134;Cp = 0.222, Cpk = 0.138

大多數人可能都會得到這樣的結果並就此打住。但是這裡關於Cp和Cpk的計算存在很明顯的錯誤,因為Cp和Cpk的計算是有兩個必要條件的③:

1. 過程是穩定的(處於統計受控狀態)

2. 所觀測的數據是呈正態分佈的

沒有這兩個必要條件所計算出來的Cp和Cpk值是不具有統計學意義的①③,或者說所得到的Cp和Cpk不準確。

上圖很明顯地看出,這個過程是處在“非穩定或非可控”(not stable or not under control)狀態,因為圖中有1個點超出了控制上限(UCL)。根據Cp和Cpk的定義,該組數據中有特別原因造成的點,過程不穩定,因此不能直接用此控制圖的數據來計算Cp和Cpk。這也是為什麼不要用數學公式來直接計算 並計算Cp和Cpk的原因。為了得到穩定的過程控制圖,需要把這個點去掉,再重新制圖,得到下面的控制圖。

Cp、Cpk、Pp、Ppk,這一文說清楚了

請注意這個圖還是有一個點是超出控制線的(R-圖中的虛線的點)(關於如何使用控制圖來判斷過程是否穩定也不屬於本文的討論範圍,可查看參考文獻③),這個點也應該被去掉。去掉這個點,可以得到下面的控制圖。

Cp、Cpk、Pp、Ppk,這一文說清楚了

Cp、Cpk、Pp、Ppk,這一文說清楚了

於是我們得到結果:

Cp = 0.330

Cpk = 0.193

可以看出實際的Cp和Cpk都有所增加。也就是說如果過程不穩定,計算出來的Cp和Cpk值會偏低,這就會低估過程的潛在能力。

根據定義,Pp和Ppk 的計算是不可以把這兩個點去掉的。因此Pp和Ppk 是不需要重新計算的。這樣針對這個例子中的數據,我們可以得到:

Pp = 0.216, Cp = 0.330;

Ppk = 0.134, Cpk = 0.193;

除了過程穩定,過程能力指數(Cp和Cpk)的計算還需要數據呈正態分佈。那麼這組數據是否符合正態分佈呢?我們可以藉助統計學工具來做分析,如下圖。可以看出p>0.05,所以這組數據是成正態分佈的。所以上面的計算是成立的。

Cp、Cpk、Pp、Ppk,這一文說清楚了

值得注意的是數據是否成正態分佈與過程是否穩定沒有直接的關係。不穩定的過程的數據也可能是成正態分佈的。

至此,該組數據(去掉兩個點)通過了這兩個測試:過程穩定和正態分佈。因此上面的關於Cp和Cpk的計算是正確的。而用於Pp和Ppk計算的數據則不必進行這兩個測試。

通過這個例子,可以將過程能力指數(Cp和Cpk)和過程績效指數(Pp和Ppk)的區別總結如下:

1. 過程能力指數(Cp和Cpk)表示的是過程在穩定(即沒有任何特殊原因或漂移干擾產出品的特性或者說是在可控(under control)的)狀態下能使其產出品達到可接受標準 的程度的指標,也可以理解為過程的"潛在"能力③。(注:"潛在"是相對目前的過程條件而言,改變過程條件可以不斷提高Cp和Cpk,這就是不斷改進(continuous improvement )的理念。因此將Cp和Cpk翻譯成"過程潛能指數"和"過程潛能K指數"更為貼切。因為Cp和Cpk體現的是穩定狀態下過程的潛在能力,因此Cp和Cpk可以用來預測該過程將來在現有過程條件下的最好的情況。

2. 過程績效指數(Pp和Ppk)則是過程在過去某個觀察時段內的實際績效,即是該過程的已經產生的產出品實際達到可接受標準的情況。它們不考慮過程是否穩定③,即便可能包括特殊原因(special cause)干擾產出品的特性或者說過程不一定處在一個可控的狀態(out of control),同樣可以計算出Pp和Ppk。由於Pp和Ppk是體現過程在過去的某個時段的績效,所以Pp和Ppk被稱為"過程績效指數"。也正因如此,Pp和Ppk 僅代表過程過去的情況,並不能用來預測過程將來的狀態③(將來可能更好也可能更壞,當然也可能一樣)。許多作者反對使用過程績效指數,因為它們沒有統計學意義,而且認為是統計學在SPC--統計學過程控制中應用的倒退③。有趣的是過程績效指數(Pp和Ppk)是美國三大汽車公司為了對其供應商的績效進行標準化而產生的,並且被納入了美國ANSI標準③。

筆者認為過程績效指數(Pp和Ppk)的產生與其計算簡單且沒有太多的統計學限制有關。因為它們始終不會大於過程能力指數(Cp和Cpk),作為過程過去的業績指標還是可以的。但是它們會低估過程的實際潛在能力,可能誤導過程改進的方向。

3. 許多作者都認為過程能力指數(Cp和Cpk)是短期過程能力指標,而過程績效指數(Pp和Ppk)是長期過程能力指標①②③⑥。但這個說法很容易被誤解為Cp和Cpk是短時間收集的數據,而Pp和Ppk是長時間觀測收集的數據。而實際上這裡的"短期""長期"與採集數據的時間長短沒有任何關係①,因為短期測試結果也可能存在由特殊原因引起的離散(variability),而長期收集的數據也可能沒有特別原因引起的離散。其本質的區別是計算中是否允許有被特殊原因引起離散的數據:Pp和Ppk是將所有被觀測的樣本數據都用於標準方差的計算, 而用於計算Cp和Cpk的西格瑪不應該包括由特殊原因引起離散的數據。

綜上,我們可以將過程能力指數(Cp和Cpk)及過程績效指數(Pp和Ppk)的本質區別總結如下:過程績效指數(Pp和Ppk)是過程的過去或現實;而過程能力指數(Cp和Cpk)是過程的潛能或將來。過程能力指數的計算必須滿足"過程穩定"和"數據正態分佈"兩個必要條件;而用於Pp和Ppk計算的數據則不必進行這兩個測試。過程能力指數及過程績效指數的數學關係是:Cp≥Pp , Cpk≥Ppk。當過程穩定(stable或under control)且數據呈正態分佈時Cp=Pp,Cpk=Ppk(注意這裡的"="是統計學意義上的相同);只要有特殊原因存在, Cp>Pp , Cpk>Ppk。理解這一點對它們的應用很關鍵。

5. Cp,Pp ,Cpk和Ppk的應用

首先了解過程能力指數和過程績效指數的區別可以幫助理解在什麼情況下采用哪個指標。通常要知道過程的實際績效情況,即過程實際的產出品滿足可接受標準的情況,應該採用過程績效指數。如果想知道目前的過程是否已經是達到了穩定的潛在狀態時,可以比較過程能力指數和過程績效指數的差別,即Cp和Pp, Cpk和Ppk的差別:二者差別越小,說明目前的過程的績效越接近穩定狀態,即過程不存在太多的特殊原因引起的偏離(variation)。如果差異很大,則說明過程不穩定,需要找出那些特別的原因,消除這些原因,過程即可被改進。管理者也可以利用過程能力指數和過程績效指數的差別,制訂不斷改進的目標。例如上面的例子Ppk=0.134, Cpk=0.193。目標可以是讓Ppk達到0.193.

瞭解了有K和沒K的區別可以幫助公司判斷過程的產出品是否偏離可接受標準的中間值。如果Pp和Ppk比較,Cp和Cpk比較,相差不大,說明過程的產出品的特性均值沒有偏離可接受標準的中間值太多。要提高Ppk或Cpk的值,只能減少點間差或樣品亞組內最大和最小值的差異,即降低過程的標準方差(S或 西格瑪)。如果Pp和Ppk比較,Cp和Cpk比較,相差很大,那麼將過程的產出品的特性的均值調整到可接受標準的中間值,就會很有效地提高Ppk和Cpk值,使過程能更好地滿足可接受標準的要求。當然這也可以通過計算樣本的均值,並和可接受標準的中間值比較來完成。

在製藥業中過程能力指數和過程績效指數的另一個方面的應用是持續過程確認(CPV)。當選定的關鍵過程參數CPP (Critical Process Parameter)或關鍵質量屬性CQA(Critical Quality Attribute)的數據經過計算得到過程能力指數和過程績效指數時,很容易看出過程是否“能達標”,也可以看出過程是否穩定。如果過程穩定,而且能達標,則可以結論目前的過程是處在可控的狀態下,即已驗證的狀態得以保持,再驗證就是不需要的。

另外,過程能力指數和過程績效指數可以被用來衡量供應商的業績。如果可接受標準是一樣的,當然指數越大的供應商越好。

Cp、Cpk、Pp、Ppk,這一文說清楚了

值得注意的是經典的作者都沒有將過程績效指數(Pp和Ppk)作為考量過程是否能達標的指標①③,因為績效指數的計算沒有考慮過程是否穩定,而沒有穩定性就沒有過程能力可言①。


6. 關於使用計算機統計軟件的討論

目前市面上有許多計算機軟件可以計算過程能力指數和過程績效指數。使用這些軟件時必須要理解軟件背後的設置,並且要了解數據是如何採集的,以及所採集的數據和所關注的過程的關係。只有這樣才能更好地解釋得到的結果。運用同樣的例子,我們可以用Minitab來計算過程能力指數。

首先我們把30天的數據都輸入Minitab,選擇"Process Capability Sixpack Report", 得到下圖。

Cp、Cpk、Pp、Ppk,這一文說清楚了

依圖可以得到以下結論:

• 數據是呈正態分佈的(p>0.05)

Cp、Cpk、Pp、Ppk,這一文說清楚了

• 過程是不穩定的(有一個點超出UCL)。儘管數據中有超出UCL的點,Minitab還是給出了計算結果:

Pp = 0.22 Cp = 0.22

Ppk = 0.13 Cpk = 0.14

這個結果和4.3節中第一次計算的結果完全一樣(有效數字不同)。

而我們知道這個結果是不準確的,因為過程能力指數是用不穩定過程的數據計算出來的。準確的結果應該是4.3節中第二次計算出來的結果:

Pp = 0.216 Cp = 0.330

Ppk = 0.134 Cpk = 0.193

也就是說Minitab這個設計從科學的角度講是不嚴謹的。

當然如果我們將除去那兩個點以後的28個數據點輸入Minitab做同樣的計算,我們得到下圖。

Cp、Cpk、Pp、Ppk,這一文說清楚了

這時只有穩定的過程的數據,過程能力指數(Cp和Cpk)的計算才是正確的。很不幸的是這裡Minitab也重新計算了績效指數(Pp和Ppk)。但原則上,這裡卻是不需要重新計算績效指數(Pp和Ppk)的。同樣可以說Minitab這個設計從科學的角度講是不嚴謹的。

值得指出的是控制圖的製作和過程能力指數的計算都是簡單的數學計算,沒有昂貴的計算機軟件同樣可以做到。以上兩個Minitab圖中的計算和前面4.3節中筆者用Excel計算和做出來的圖是一樣的。


7. 總結

過程能力是指過程離散度的6西格瑪寬度,與其產出品的可接受標準無關。如果過程的產出品的數據是呈正態分佈的,那麼99.73%的數據會落在這個6西格瑪的寬度內。

常用的衡量過程能力的指標有過程能力指數(Cp和Cpk)和過程績效指數(Pp和Ppk)。沒k指數(Cp和Pp)只顯示過程的產出品的離散程度和可接受標準的關係;而有k指數(Cpk和Ppk)除了顯示過程的產出品的離散程度和可接受標準的關係外,還關注過程的產出品的均值是否偏離可接受標準的中間值,其數學關係是:Cpk≤Cp;Ppk≤Pp。

過程能力指數(Cp和Cpk)和過程績效指數(Pp和Ppk)的主要區別是:

1)過程能力指數Cp和Cpk)的計算需要滿足兩個條件--過程穩定且數據呈正態分佈,而過程績效指數(Pp和Ppk)的計算則不需要考慮這兩個條件。

Cp、Cpk、Pp、Ppk,這一文說清楚了

過程能力指數(Cp和Cpk)是具有統計學意義的指數,表示的是過程的“潛能”,可以用來預測過程的將來,而過程績效指數(Pp和Ppk)的統計學意義並不被專家們接受,並且不能被用來有效地預測過程的未來。


8. 後記

過程能力指數是上個世紀後期才產生出來的概念。最早Cp是由Juran於1974年提出來的,而Cpk是Kane於1986年才提出來的⑦。而且用於衡量過程能力的指數仍在不斷髮展中,新的指標也不斷地被提出。本文僅僅探討了4個最常用的指標。另一個較常用的指標是Cpm。由於篇幅和其應用的限制,這裡不做介紹,有興趣的讀者可以閱讀參考文獻⑦。

過程能力指數(Cp和Cpk)可以被用來估計有多少產出品會落在可接受標準的外面(即不合格品)。當Cp= Cpk =1時,而且數據是呈正態分佈的話,99.73%的數據都會落在可接受標準的區間內。具體的計算需要更深的統計學知識。這裡也不做介紹,有興趣的讀者可以參考文獻③。

另一個重要的理念是以上關於過程能力指數(Cp和Cpk)的計算是“估計”值,因為過程的西格瑪和均值都是通過樣本的值來估計的。因此過程能力指數Cp和Cpk的準確性是可以通過統計學計算來建立“置信空間”(confidence interval)的。同樣基於篇幅的原因,這裡不做詳細介紹,有興趣的讀者也可以參考文獻③。


9. 參考文獻

①Manuel E. Peña-Rodríguez:Statistical Process Control for the FDA-Regulated Industry, ASQ2013

②Joseph M. Juran: Juran’s Quality Handbook, 5th Edition, McGraw-Hill, 1998

③Douglas C. Montgomery:Statistical Quality Control,Wiley,2012

④Roger Hoerl & Ronald D. Snee: Statistical Thinking, Duxbury, 2002

⑤Brain K. Nunnally & John McConnell: Six Sigma In The Pharmaceutical Industry, IRC Press 2007

⑥https://www.isixsigma.com/tools-templates/capability-indices-process-capability/

⑦Samuel Kotz & Norman L. Johnson:Process Capability Indices-A Review, 1992-2000, Journal of Quality Technology, Vol. 34, No.1, 2002


來源網絡。

"


分享到:


相關文章: