我发现好多人都没把这两个玩意儿彻底搞清楚。有些论文里的错误比较隐晦,但有些一眼就能看出来作者没搞懂,用错了。
这两个东西公式一样,但统计含义和应用场景却大相径庭。
决定系数(Coefficient of determination,R2, R-square)是做线性回归时的常客。它的核心任务是解释方差,就是你的回归公式(Regression Line)在多大程度上解释了数据y的波动。 它的范围通常是 0 到 1。
当你画y和x的散点图并计算R-square时,它衡量的是数据点仅仅围绕最佳拟合线 (Regression Line)的紧密程度。如果 R-square = 1,说明所有点都完美地落在回归线上。这条回归线可以是任何斜率,不一定是 y=x。
Continue reading
