在日常生活中,我们经常会遇到一些需要进行预测(估计)的情况。与之同时,会遇到一个很实际的问题,老板会提出一些针对预测(估计)的需求。
于是,工程师们开始玩命的研究统计学,希望从中找出一种"既能获得准确可信的估计结果,又能少抽样"的统计工具。
大家要牢记一点,如果希望通过抽样来进行某种估计,那么:
估计的风险是必然存在的
统计学家和半仙们的最大区别在于:
换句话说,半仙们的估计是这样的:
而统计学家的估计是:
因此,基于统计学而言,总是用一个包含概率的结果来表示估计的结论。这个概率被称为"置信概率"。可以理解为,我们有多少信心(概率)来保证估计的结果是准确(可信)的。
在收集的信息量相同的情况下,估计结果和估计的置信(可信)概率之间的关系是这样的。
注:为什么是-273℃而不是负无穷大,请百度"绝对零度"的定义。
我们发现一个问题,在不增加信息量的情况下,要求增加估计的置信(可信)概率是徒劳的。这个时候,统计上给出的置信区间宽度会随着置信概率的增加而变大,最终变得毫无参考意义。
如果我们预先规定估计的置信(可信)概率保持不变(比如95%),而又希望获得有意义的置信区间(这意味着置信区间的宽度应该尽量"窄"),只能通过增加抽样样本量来实现。
例如,我们查阅GB2828.1的标准,希望获得一个抽样计划来判断整个批次产品的是否能接受的时候,都会有一个疑问:为什么要抽那么多的样本量?假设,我们查阅GB2828.1,得到一个抽样计划是:
抽样样本量n=125,不良品数要求:5收6退
那么,为什么不能抽25件,1收2退呢?我们用Minitab软件来计算一下两种情况下的95%置信区间。
对照可以发现,两种抽样情况下的95%置信区间的宽度差异非常大。
因此,对于工程师而言,能否找到一种统计方法,实现"抽样数量少并且估计结果准确"呢?最终结论是:
了解更多统计工具统计培训知识,点击下面链接报名
閱讀更多 IATF16949 的文章