Category Archives: Essentials

Important, practical, but not purely technical nature of these posts

 别搞错了:决定系数 vs 纳什系数

我发现好多人都没把这两个玩意儿彻底搞清楚。有些论文里的错误比较隐晦,但有些一眼就能看出来作者没搞懂,用错了。

这两个东西公式一样,但统计含义和应用场景却大相径庭。

决定系数(Coefficient of determination,R2, R-square)是做线性回归时的常客。它的核心任务是解释方差,就是你的回归公式(Regression Line)在多大程度上解释了数据y的波动。 它的范围通常是 0 到 1。

当你画y和x的散点图并计算R-square时,它衡量的是数据点仅仅围绕最佳拟合线 (Regression Line)的紧密程度。如果 R-square = 1,说明所有点都完美地落在回归线上。这条回归线可以是任何斜率,不一定是 y=x。

Continue reading

概率为0的事情经常会发生

晚餐时突然聊到人老了会死,看到一个微信视频说,人本来就是一群原子分子,突然组合到一起有了生命,死了就是回归到原本的样子。想想挺神奇,为什么这么一群原子分子突然就变成生命的样子,而其他的原子分子还是泥巴石头的样子。

突然联想到我在课程上跟学生讲的p=0(概率为0),不等于是不可能事件。课本上经常把p=1描述为必然事件,p=0就是不可能事件,好像不可能发生。这是错的。

世界上这么多分子原子,所以从中选一群分子原子变为一个人的概率等于0(不是约等于,而是数学意义上的等于0),但世界上又有这么多人,每个人都对应一群分子原子,这些分子原子变为人的概率为0,但它们的确变成为了人。是这样吧,是不是被绕进去了。

讲清楚这个事情,我们往往用另一个更好理解的事情来描述,假设一个方块,我们往里面随机扎针,对于一个无限精准的位置,被针扎中的概率为0,但每次我们扎一次,总有一个位置被扎中,这个位置被扎中的概率为0,但是被扎中了。所以概率为0的事情这时候发生了。

拓展开来,一个连续随机变量X的概率密度函数是一条连续曲线,X=x的概率都为零,只有 [x1, x2]间隔内的概率才有意义,概率老师们是这样讲的吧。现在大家可以联系到一起了,这不等于说X=x绝不可能发生(老师们为了让学生好理解起见,往往就这么跟学生解释)。它只是说数学上概率为零。数学上有一个有意思的函数,叫Delta函数,是一个脉冲,宽度为0,高度为无穷大,但积分为一个确定值1(一)。是不是也不好理解。

径流与流量

下图是某初中课本上阐述水资源时间分配不均的配图。Z老师在微信上问我单位有没有问题。后来也得知不少中学老师也发现了不对。这里单位的确错了。但其实这里涉及的概念还是挺多挺乱的,需要好好讲讲。

某初中课本上关于水资源时间分配的配图单位有问题
Continue reading

同一门课程多班教学的成绩调整方法

一般讲小班教学(20-30人)效果比较好。但是,如果同一门课程分为几个小班,由不同老师授课,就会经常出现一个问题,即如何让各个小班成绩具有可比性。这是一个非常现实的问题,不同老师有不同的教学风格,尤其是在主观题评价方面,有老师严格有老师相对宽松。但学生们最终的综测成绩时并不区分这些差别,而是直接进行排名。拿到一个公平的成绩是学生们很关心的事情。

为了解决这个问题,我们采用一个曲线调整(Curve)的方法。通过强制不同小班的中位数(Median)保持一致,对每位同学的分数进行非线性调整,从而使不同班级分数具有可比性。这也是很多标准化教学采用的方法(当然可能使用的公式不同)。

Continue reading

生活经验之沐浴间疏通

人住高层的,大概谁家都有淋浴间堵塞的时候,我家就试过各种法子,比如化学(cleaners)溶解、用钢丝(drain augers)疏通等等,花了不少钱,经常不行。不同方法可能有不一样的适用场合。解决高层淋浴间堵塞的难点大概在于1 经常是由于毛发积累引起;2 因为防臭设计,下水管道经常存在一个U型结构。。

半年前发现一个工具,原理是利用气压,利用打气筒把气压提升上去,将之放进管道口并密封起来,然后伴随着气压释放产生的嘭的一声,一众手段解决不了的问题居然迎刃而解。推荐给周边朋友试用过,均曰之神器!

唯一注意之处是千万不要气压过大,把下水的PVC管给弄破了,大概楼上楼下的邻居们都要找上门来了。哈哈。

Drain blaster / toilet plunger