回归分析

1. 回归分析基础

      回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析。按照因子和结果之间的关系类型,可分为线性回归分析和非线性回归分析。

2. 软件工程过程回归建模流程

    a)过程因果分析

    b)基于因果分析结果,收集结果和因子的数据,对数据进行验证和确认

    c)对结果和每个因子之间进行相关性分析

    d)对结果和所有因子进行最佳子集分析,如果最佳子集分析结果理想,进行回归建模;否则对因子进行各种变换(比如指数、对数、二阶、三阶等)再进行最佳子集分析,直到获取最佳子集。在最佳子集的基础上,进行回归分析

    e)对回归分析的结果进行残差检验,确保模型的有效性

    f)对回归分析的结果进行显著性检验,包括整体的显著性检验和各个因子的显著性检验

    g)对回归分析的结果进行相关性分析

    h)在满足相关性和显著性前提下,对模型进行语义分析和极值分析

3. 模型判断准则

  • 相关性系数:+-0.5 --- +- 0.8 显著正负相关;+-0.8 --- +-1.00 高度正负相关
  • 模型整体假设检验,p <= 0.05
  • 因素假设检验, p<= 0.05

4. 软件工程过程建模关键点

  • 模型兼顾中间结果---最终结果
  • 过程或子过程关联---阶段或LC
  • 可控因子---不可控因子
  • 因子的“不确定性”建模

5. 回归建模在MiniTab中的应用

相关性分析:MiniTab 16, “统计”--“方差分析”

最佳子集:MiniTab 16, “统计”--“回归”--“最佳子集”

线性回归:MiniTab 16, “统计”--“回归”--“回归”

非线性回归:MiniTab 16, “统计”--“回归”--“广义回归”