02.21 正态分布,谁与争峰

大千世界随机现象众多,其分布各异。

按数据变量类型划分可以分为离散型与连续性两类:

离散型变量根据名称很好理解,就是数据的取值是不连续的。例如掷硬币就是一个典型的离散数据,因为抛硬币的就2种结果。你可以把离散数据想象成一块一块垫脚石,你可以从一个数值调到另一个数值,同时每个数值之间都有明确的间隔。

正态分布,谁与争峰


离散型(r,v)随机变量的研究工具是概率分布律,即r.v X在它的各个可能取值点的概率。

例:x-b(30,0.1)

正态分布,谁与争峰


例:参数为6的泊松分布

正态分布,谁与争峰


第2种是连续型变量数据。连续数据正好相反,它能取任意的数值。连续数据就像一条平滑的、连绵不断的道路,你可以沿着这条道路一直走下去。

正态分布,谁与争峰


研究连续型随机变量的工具是密度函数(pdf).

正态分布,谁与争峰


概率论中最重要的分布--正态分布

正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布.

冠名权那是一个很高的荣誉。早年德国的钢镚和10马克的纸币上都留有高斯的头像和正态密度曲线。正态分布被冠名高斯分布,我们也容易认为是高斯发现了正态分布,其实不然,不过高斯对于正态分布的历史地位的确立是起到了决定性的作用。

正态分布,谁与争峰


正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。

这个钟型的分布曲线不但形状优雅,其密度函数更加的简洁漂亮,两个最重要的数学常量π,e 都出现在了公式之中。在我个人的审美之中,它也属于top-N的最美丽的数学公式之一,如果有人问我数理统计领域哪个公式最能让人感觉到上帝的存在,那我一定投正态分布的票。因为这个分布戴着神秘的面纱,在自然界中无处不在,让你在纷繁芜杂的数据背后看到隐隐的秩序。

正态分布,谁与争峰


:标准正态分布图像

正态分布,谁与争峰


正态分布无处不在,有些人甚至会觉得正态分布是否存在于世界上的任何分布里?统计学史上的重要人物弗郎西斯高尔顿正是这样认为的,真是正态分布一出,谁与争峰!

统计学中最常用的三大分布卡方分布、t-分布、F-分布,当它们的自由度变大时都会趋向于正态分布。

为什么说正态分布是概率论中最重要的分布?

答:正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

【正态分布——教育统计学】

统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。

【正态分布——友谊、爱情、婚姻和人生】

生活里处处都是正态分布。

最要好,贴心的朋友,伙计儿,哥们儿不会很多,明争暗斗,勾心斗角的朋友也是少数,大部分的朋友都是不冷不热,不疏远也不亲近。见面笑嘻嘻,分别忘干净。一个很标准的正态分布。大多数人都在95%的置信区间,少数人在两尾。所以要珍惜那些在右尾上的好朋友们。而对在95%的那些朋友也就少些期待和要求。

爱情也是这样,随着早期的甜蜜一日不见如隔三秋,据科学研究是2年的时限,我们的大脑不再分泌爱情荷尔蒙的时候,大部分的日子都是平淡不浪漫的的,谈点小情说点小爱,小吵小闹组成了爱情这个钟型图。而绝裂的争吵憎恨也是少数。有了这些少数的争吵,我现在假设他们都是正面的积极的,就会产生一个反重用导致爱的突然上升,于是有一些在另一尾的极少的甜蜜和缠绵。

人生自然也是符合正态分布的。生命历程里的大多数日子里我们都在95%或99%这个区间内,注定碌碌无为平庸无奇,相信总结出人生的真谛就是平淡,平凡,平常的人一定也可能根据借鉴过理论。那些惨绝无伦的日子毕竟还是少数。平淡日子里积攒的力量也许为的就是那一尾的精彩爆发。

从社会构建主义的理论出发,人生是一个动态的,多元的过程。凡是没有绝对,比如什么是真理,事实,美,丑都不再有统一的定论。那这个正态分布也是一样的。有一般朋友向知己的过渡,也有好朋友最后变为陌路人。有危机重重的婚姻爱情最后坚守并甜蜜久久,也有柔情似水假期如梦的爱情最后随风而逝,飘过无痕。关键是心态和行动的问题。

发挥主观能动性,培养主人翁精神,这些读书时看是死板教条的东东换个角度来看,其实也不无道理。毕竟,人生只有一回。怀着感恩的,宽广的心,享受给与也乐于回报。接受不能实现的现实,不能完成的心愿,不能把握的人或事儿。快不快乐,幸不幸福都在我们的一念之间。

【正态分布——范跑跑】

在大洋网开展的“是否赞成对教师实施‘禁跑令’”的调查中,有近70%的网友持反对意见,认为这样的硬性规定太过漠视教师的生命。况且舍己救人的行为,主要取决于一个人的思想境界,而不是绝对应该和必须的。因为从心理学角度来说,人类的社会道德是呈正态分布的,就是一个纺锤形的曲线――英雄是少数的,罪人是少数的,大多数人是中间态的。我们必须接受这个现实,不能要求人人成为英雄,以英雄的标准去要求常人甚至当成基本的要求。


分享到:


相關文章: