• 1.摘要
  • 2.基本信息
  • 3.基础定义
  • 4.演绎过程
  • 5.历史沿革
  • 6.相关内容
  • 7.主要特征
  • 8.置信区间

t分布

数学术语

t分布(也叫学生t-分布;t-distribution),用于根据小样本来估计呈正态分布且方差未知的总体的均值。

如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。

t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。

基本信息

  • 中文名

    t分布

  • 外文名

    t-distribution

  • 学科

    概率论和统计学

  • 应用

    在对呈正态分布的总体

  • 相关术语

    t检验

基础定义

由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。如图1

图1
t分布

其中,Gam(x)为伽马函数。

t分布

演绎过程

下表列出了自由度为1-30以及80、100、120等t-分布的单侧和双侧区间值。例如,当样本数量n=5时,则自由度df=4,我们就可以查找表中以4开头的行。该行第5列值为2.132,对应的单侧值为95%(双侧值为90%)。这也就是说,T小于2.132的概率为95%(即单侧),记为Pr(−∞ <T< 2.132) = 0.95;同时,T值介于-2.132和2.132之间的概率为90%(即双侧),记为Pr(−2.132 <T< 2.132) = 0.9。

这是根据分布的对称性计算得到的。

  • Pr(T< −2.132) = 1 − Pr(T> −2.132) = 1 − 0.95 = 0.05

因此,

  • Pr(−2.132 <T< 2.132) = 1 − 2(0.05) = 0.9

注意关于表格的最后一行的值:自由度为无限大(n=120)的t-分布和正态分布等价

单侧

75%

80%

85%

90%

95%

97.5%

99%

99.5%

99.75%

99.9%

99.95%

双侧

50%

60%

70%

80%

90%

95%

98%

99%

99.5%

99.8%

99.9%

1

1.000

1.376

1.963

3.078

6.314

12.71

31.82

63.66

127.3

318.3

636.6

2

0.816

1.061

1.386

1.886

2.920

4.303

6.965

9.925

14.09

22.33

31.60

3

0.765

0.978

1.250

1.638

2.353

3.182

4.541

5.841

7.453

10.21

12.92

4

0.741

0.941

1.190

1.533

2.132

2.776

3.747

4.604

5.598

7.173

8.610

历史沿革

1/3

在概率论和统计学中,学生t-分布(Student'st-distribution)经常应用在对呈正态分布的总体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生t测定的基础。t检定改进了Z检定(en:Z-test),不论样本数量大或小皆可应用。在样本数量大(超过120等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t检定。在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t检定。

当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。

学生t-分布可简称为t分布。其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。