统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

在日常生活中,我们经常会遇到一些需要进行预测(估计)的情况。与之同时,会遇到一个很实际的问题,老板会提出一些针对预测(估计)的需求。

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

于是,工程师们开始玩命的研究统计学,希望从中找出一种"既能获得准确可信的估计结果,又能少抽样"的统计工具。

大家要牢记一点,如果希望通过抽样来进行某种估计,那么:

估计的风险是必然存在的

统计学家和半仙们的最大区别在于:

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

换句话说,半仙们的估计是这样的:

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

而统计学家的估计是:

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

因此,基于统计学而言,总是用一个包含概率的结果来表示估计的结论。这个概率被称为"置信概率"。可以理解为,我们有多少信心(概率)来保证估计的结果是准确(可信)的。

在收集的信息量相同的情况下,估计结果和估计的置信(可信)概率之间的关系是这样的。

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

注:为什么是-273℃而不是负无穷大,请百度"绝对零度"的定义。

我们发现一个问题,在不增加信息量的情况下,要求增加估计的置信(可信)概率是徒劳的。这个时候,统计上给出的置信区间宽度会随着置信概率的增加而变大,最终变得毫无参考意义。

如果我们预先规定估计的置信(可信)概率保持不变(比如95%),而又希望获得有意义的置信区间(这意味着置信区间的宽度应该尽量"窄"),只能通过增加抽样样本量来实现。

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

例如,我们查阅GB2828.1的标准,希望获得一个抽样计划来判断整个批次产品的是否能接受的时候,都会有一个疑问:为什么要抽那么多的样本量?假设,我们查阅GB2828.1,得到一个抽样计划是:

抽样样本量n=125,不良品数要求:5收6退

那么,为什么不能抽25件,1收2退呢?我们用Minitab软件来计算一下两种情况下的95%置信区间。

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

对照可以发现,两种抽样情况下的95%置信区间的宽度差异非常大。

因此,对于工程师而言,能否找到一种统计方法,实现"抽样数量少并且估计结果准确"呢?最终结论是:

统计也能玩花样 04(詹大师)如何获得有参考价值的统计分析结果

了解更多统计工具统计培训知识,点击下面链接报名


分享到:


相關文章: