数值变量的推断

[TOC]

t分布

假设$n$为样本的大小,当$n$比较小而且$\sigma$未知的时候,通常使用t分布来描述样本的统计值的分布情况。t分布有一个参数$df$,称之为自由度。下图是t分布的图像:

可以发现当$df$趋向于无穷大的时候,t分布就是正态分布。

......

继续阅读

假设检验

[TOC]

假设检验, p-value, significance

假设检验不仅在实际的科学实验中用得多,甚至当时在上机器学习技法课程的时候,有一道题的两个选项的数值比较接近,老师还使用假设检验来判断数值之间差异的显著性(significance)。那么假设检验到底要解决什么问题呢?

一个实例

假设在一个公司里面男女员工的升职情况如下:

继续阅读

统计决策小结之三

[TOC]

Central Limit Theory

中心极限定理讲的是什么呢?以前对这个概念已知很模糊,以为只要对总体采样足够多就可以得到一个正态分布。事实上,仔细想想这肯定是不对的,因为如果全部都采集来的话就是原来的总体,怎么能肯定得到一个正态分布的结果呢?

正态分布讲的是:

The distribution of sample statistics is nearly normal,......

继续阅读