立即注册 登录
公卫人 返回首页

xiaopang1980的个人空间 http://www.epiman.cn/?2113 [收藏] [复制] [RSS]

日志

小胖说统计之二六四:概率分布(三)

热度 75已有 10749 次阅读2010-10-23 22:49

一提到概率分布,我们一般第一想到的便是正态分布,有人说没有正态分布就没有统计,由此正态分布的普遍性和重要性不言而喻。

 

那么为什么正态分布如此普遍和重要呢?

 

首先,很多情况下,自然界很多东西都是自然呈正态分布的,而更重要的原因在于中心极限定理(central limit theorem)的应用。所谓中心极限定理是指当样本量足够大时,无论其总体分布如何,其样本均数趋于正态分布。中心极限定理为正态分布的普遍应用提供了最为坚实的理论基础。而对于上则几百例病人的临床试验来说,正态分布更是找到了其适合生长的最好土壤。另外,我们常用的一些统计方法都是依赖于正态分布的:

 

(1)       一些统计方法如t检验和方差分析,其应用的前提条件就是要求数据服从正态分布

(2)       而对于一些统计模型来说,比如线性模型,往往要求其残差服从正态分布。

 

关于正态分布在统计模型中的应用,下边有一段论述很有意思,小胖摘抄下来供大家参考:

 

正态分布对统计学家从某种角度来说是“垃圾的分布”。

 

 当向一个统计学家问什么是正态分布时,他会回答:当一个变量有多个、解释不清的因素决定,而且每个因素的作用都不强,于是变量就呈现正态分布。


一个随机变量中有两种成分,一是非随机成分,一是随机成分分。建模把非随机部分用模型(函数形式)来表达,纯随机的成分就成了残差。


回归不论线性与否,残差是正态,说明模型不能表达的成分确实是垃圾,不能再处理的。


但是,我们把数据馈入模型,结果发现残差非正态(或并非白噪音),怎么办,最理想的办法是修改模型,使其符合正态假设。回归其实就是在杂乱的信息中,把有规律的信息用模型表达出来,而无规律的白噪声滤掉。

3

路过

鸡蛋
46

鲜花
20

握手

雷人

刚表态过的朋友 (69 人)

发表评论 评论 (10 个评论)

回复 qmax 2010-11-10 22:24
还因为,概率论中对正态分布研究的较为透彻。
回复 如是 2010-11-17 15:42
正态分布的重要性只需答上述的两点吗?
回复 1224td 2012-2-24 18:08
有实际的医学应用的例子吗?我的意思是一些例题想看一下哦
回复 无休止奔跑 2013-10-6 19:18
厉害1111
回复 张淮6 2014-4-2 17:54
  
回复 №祝唠唠№ 2015-1-13 15:40
为什么不再更新了
回复 猫猫咪吖 2015-3-15 21:22
32个赞
回复 全力以赴100 2015-5-22 22:46
  
回复 年迈的小麦 2015-7-12 23:18
这是最终话么~?~
回复 爱上绿萝的太阳 2016-9-23 23:08
还有吗

facelist

您需要登录后才可以评论 登录 | 立即注册

手机版|会员|至尊|接种|公卫人 ( 沪ICP备06060850号-3 )

GMT+8, 2024-4-24 09:47 , Processed in 0.047343 second(s), 7 queries , Gzip On, MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

返回顶部