常用统计学名词解释

发布于:2023-01-01 ⋅ 阅读:(1415) ⋅ 点赞:(1)

1、自由度常用统计学名词解释

定义:当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度。对于N个随机样本而言,自由度df=N-1

例:对于一个多元线性方程,假设有m个未知数,则:SST的自由度为n-1,SSR的自由度为m,SSE的自由度为n-1-m。

自由度(统计学术语)_百度百科 (baidu.com)

2F检验

定义:别名也叫联合假设检验、方差齐性检验,在零假设之下,统计值服从F-分布的检验。通常用来分析线性回归模型中全部或一部分参数是否适合估计总体。

公式:

p为SSR的自由度,n-p-1为SSE的自由度。

此F服从~F(p,n-p-1) 如果F>F(p,n-p-1,alpha=0.05)则说明回归方程效果显著,否则不显著(考虑非线性关系)

临界值查看表:F检验临界表 - 豆丁网 (docin.com)

一文详解F检验 - 知乎 (zhihu.com)

F检验_百度百科 (baidu.com)

3t检验值

用途:

1、单样本均值检验:总体方差未知,正态数据或近似正态的单样本的均值是否与已知的总体均值相等。

2、两独立样本均值检验:两对独立的正态数据或近似正态的样本均值是否相等

3、配对样本均值检验:一对配对样本的均值的差是否等于某一个值

4、回归系数的显著性检验:回归模型的解释变量对被解释变量是否有显著影响

对于回归系数的显著性检验公式:

 一般来说β(j-1)=0

sigmoid为sqrt(SSE)

t临界值表?(只找到单侧与双侧的表)

一文详解t检验 - 知乎 (zhihu.com)

4、置信区间

A. 定义:置信区间又称为估计区间,是用来估计参数的取值范围。

·点估计:例如一个样本的均值为a,用a来估计总体均值即为点估计

·区间估计:因为点估计存在误差,所以给出一个区间范围,让均值处在这个范围中。区间估计也即对应了置信区间。

·置信水平:总体参数值落在置信区间的概率

B. 置信区间计算方法:样本点估计+/- (C值*点估计标准差)

不同的置信水平对应了不同的C值:置信水平越大,区间范围越大

[统计学理论基础] 置信区间_memoryqiu的博客-CSDN博客

置信区间 - 知乎 (zhihu.com)

本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到