Tag Archives: math

 别搞错了:决定系数 vs 纳什系数

我发现好多人都没把这两个玩意儿彻底搞清楚。有些论文里的错误比较隐晦,但有些一眼就能看出来作者没搞懂,用错了。

这两个东西公式一样,但统计含义和应用场景却大相径庭。

决定系数(Coefficient of determination,R2, R-square)是做线性回归时的常客。它的核心任务是解释方差,就是你的回归公式(Regression Line)在多大程度上解释了数据y的波动。 它的范围通常是 0 到 1。

当你画y和x的散点图并计算R-square时,它衡量的是数据点仅仅围绕最佳拟合线 (Regression Line)的紧密程度。如果 R-square = 1,说明所有点都完美地落在回归线上。这条回归线可以是任何斜率,不一定是 y=x。

Continue reading

概率为0的事情经常会发生

晚餐时突然聊到人老了会死,看到一个微信视频说,人本来就是一群原子分子,突然组合到一起有了生命,死了就是回归到原本的样子。想想挺神奇,为什么这么一群原子分子突然就变成生命的样子,而其他的原子分子还是泥巴石头的样子。

突然联想到我在课程上跟学生讲的p=0(概率为0),不等于是不可能事件。课本上经常把p=1描述为必然事件,p=0就是不可能事件,好像不可能发生。这是错的。

世界上这么多分子原子,所以从中选一群分子原子变为一个人的概率等于0(不是约等于,而是数学意义上的等于0),但世界上又有这么多人,每个人都对应一群分子原子,这些分子原子变为人的概率为0,但它们的确变成为了人。是这样吧,是不是被绕进去了。

讲清楚这个事情,我们往往用另一个更好理解的事情来描述,假设一个方块,我们往里面随机扎针,对于一个无限精准的位置,被针扎中的概率为0,但每次我们扎一次,总有一个位置被扎中,这个位置被扎中的概率为0,但是被扎中了。所以概率为0的事情这时候发生了。

拓展开来,一个连续随机变量X的概率密度函数是一条连续曲线,X=x的概率都为零,只有 [x1, x2]间隔内的概率才有意义,概率老师们是这样讲的吧。现在大家可以联系到一起了,这不等于说X=x绝不可能发生(老师们为了让学生好理解起见,往往就这么跟学生解释)。它只是说数学上概率为零。数学上有一个有意思的函数,叫Delta函数,是一个脉冲,宽度为0,高度为无穷大,但积分为一个确定值1(一)。是不是也不好理解。

美赛2025

陪着学生完成了今年美赛(美国大学生数学建模,24-28日),直到上午10点提前10分钟提交了答案 才感觉心安了 中午补了个觉。这是第三次指导,前两次都获的m奖(两万多只队伍前10% 主要是中国大学生玩)。第一次刘雨璇她们用着李龙辉的办公室 我就负责给他们送早餐;第二次殷子云他们遭遇团队罢工 殷子云独立扛下来了。这次三位女生配合相当好。每次都是数个无眠夜,完赛后学生精神恍惚但亢奋。美赛玩的从来都是爱好和热情 没啥名利可图 师生都是。充分诠释坚持就是胜利!

亚太大学生数模问题C是不是太像中学生美赛问题B

偶然发现一个有意思的情况,2022年的亚太地区大学生数模问题C好像长的很像2022年美国高中生数模竞赛(HiMCM)的问题B,如图所示。

其中亚太数模是关心全球气温变化,以及分析气温变化的可能原因;美赛则提供了二氧化碳(CO2)和全球气温变化数据,在分析CO2变化的基础上,建立CO2持续增多与全球气温变化的数学关系。亚太数模是2022年11月24日开赛,而美赛是2022年11月2日,早于亚太数模竞赛时间。

其中,亚太第1问与美赛第1问的遣词造句尤其像,大概就是把美赛问题中的CO2变化为气温。此外几个域值也对应做了改动。考虑到气温存在季节和年际的较大波动,而CO2变化相对稳定,问题1a(相比过去任何10年的变量,某年某月的变量是否增幅最大)看起来美赛更有道理。

两者问题的背景阐述都差不多,描述了CO2增加与全球变暖,所以美赛提供了CO2和气温数据要求分析两者关系,而亚太题干并没有明确提及CO2,相比之下美赛问题再下一城。

Continue reading