方差分析、相关分析、回归分析
第一章:方差分析
1.1 方差分析概述
- 作用: 找出关键影响因素,并进行对比分析,选择最佳组合方案。
- 影响因素: 控制因素(人为可控)和随机因素(人为难控)。
- 控制变量的不同水平: 控制变量的不同取值或水平。
- 观测变量: 受控制变量和随机变量影响的变量。
- 两类误差:
- 随机误差:同一水平下样本观察值之间的差异。
- 系统误差:不同水平下各观察值之间的差异。
- 方差分析原理: 从观测变量的方差分解入手,研究控制变量的不同水平以及各水平的交互搭配如何影响观测变量。
- 假设前提: 观测变量各总体服从正态分布,观测变量各总体的方差相同。
- 分类: 单因素/多因素,一元/多元。
1.2 单因素方差分析
- 定义: 研究一个控制变量的不同水平是否对观测变量产生显著影响。
- 基本思想: 将观测变量的总离差平方和分解为组间平方和和组内平方和,比较两者比例判断控制变量是否对观测变量有显著影响。
- 基本步骤:
- 提出假设。
- 计算检验统计量和概率P值。
- 决策:比较显著性水平和P值,判断是否拒绝原假设。
- SPSS操作步骤:
- 选择菜单 “分析”-“比较平均值”-“单因素 ANOVA检验”。
- 将观测变量选择到 “因变量变量” 。
- 将控制变量选择到"因子"。
- 进一步分析:
- 方差齐性检验:检验控制变量不同水平下各观测变量总体方差是否相等。
- 多重比较检验:对每个水平下的观测变量均值进行逐对比较,判断两均值之间是否存在显著差异。
- 其他检验:先验对比检验和趋势检验。
1.3 多因素方差分析
-
定义: 研究两个及两个以上控制变量的不同水平是否对观测变量产生显著影响。
-
基本思想: 将观测变量的总离差平方和分解为控制变量独立作用、控制变量交互作用及随机误差三部分。
-
基本步骤: 与单因素方差分析类似,但需要考虑多个控制变量及其交互作用。
-
SPSS操作步骤:
-
进一步分析:
- 非饱和模型:将观测变量总的变差分解为控制变量独立作用、控制变量交互作用及随机误差三部分,但将某些部分合并到随机误差中。
- 均值检验:对各个控制变量不同水平下的均值是否存在显著差异进行比较。
- 控制变量交互作用的图形分析:通过图形直观分析控制变量间是否存在交互作用。
第二章:相关分析
2.1 相关分析概述
- 相关关系: 两事物之间的非一一对应关系,例如家庭收入和支出。
- 分类: 线性相关和非线性相关。
- 与回归分析的区别:
- 相关分析:变量地位对等,只能判断关系的方向和强弱。
- 回归分析:区分因变量和自变量,可以具体得出自变量对因变量的影响程度。
2.2 绘制散点图
- 作用: 直观地发现变量间的相关关系及它们的强弱程度和方向。
- 类型: 简单散点图、重叠散点图、矩阵散点图、三维散点图。
2.3 相关系数
-
作用: 衡量变量间线性关系的强弱程度和方向。
-
类型:
- Pearson 简单相关系数:适用于两个变量都是定距型变量。
- Spearman 等级相关系数:度量定序变量间的线性相关关系。
- Kendall 相关系数:非参数检验方法度量定序变量间的线性相关关系。
-
SPSS操作步骤:
第三章:回归分析
3.1 回归分析概述
- 作用: 分析客观事物之间相关关系的数量分析方法。
- 步骤:
- 确定解释变量和被解释变量。
- 确定回归模型。
- 确定回归方程。
- 对回归方程进行各种检验。
- 利用回归方程进行预测。
3.2 线性回归分析
- 数学模型: 一元线性回归模型和多元线性回归模型。
- 最小二乘法: 求解回归方程中的参数。
3.3 回归方程的统计检验
- 拟合优度检验: 衡量回归直线与各观测点的接近程度,常用可决系数(R²)表示。
- 回归方程的显著性检验 (F检验): 检验被解释变量与所有解释变量之间的线性关系是否显著。
- 回归系数的显著性检验 (t检验): 检验回归方程中被解释变量与每一个解释变量之间的线性关系是否显著。
3.4 残差分析
- 残差: 由回归方程计算得到的预测值与实际样本值之间的差距。
- 残差分析内容: 残差是否服从均值为零的正态分布,残差是否为等方差的正态分布,残差序列是否独立。
3.5 多元回归分析中的其他问题
- 解释变量的筛选问题: 引入多少个解释变量,筛选策略(向前筛选、向后筛选、逐步筛选)。
- 多重共线性问题: 解释变量之间存在线性相关关系,测度方法(容忍度、方差膨胀因子、特征根和方差比、条件指数)。
3.6 线性回归分析的基本操作
3.7 应用举例
- 实例: 建立回归方程研究高校科研研究数据,分析课题总数受哪些因素的影响。
- 分析内容: 回归方程的估计、回归方程的三项检验(拟合优度检验、F检验、t检验)、残差的检验(均值为零的正态检验、自相关检验、异方差检验)、多重共线性检验。