名校也有傻缺?这是再正常不过的事情了
中美网美国留学 www.usaer.net 2015-07-29 来源: 北美留学生日报 编辑: Alice
“When I was at Cornell, I was rather fascinated by the student body, which seems to me was a dilute mixture of some sensible people in a big mass of dumb people” (“当我在康奈尔大学的时候,我觉得学生群体很有意思。他们仿佛是一些靠谱的人被稀释在人数巨大的傻缺群中。”)
我有幸也曾经求学于美国西岸一所名校。在那里读书的日子里,有些遭遇也让我不禁疑惑:我靠,似乎什么人都能进这所闻名世界的学府呀。后来用数学推算一下,倒也不奇怪了。
“名校傻X” (原题用词如此)这个现象,可以用统计学中的 type I & type II error 来解释。这个概念又可以被称作假阳性(false positive)、假阴性(false negative)。简单来说,就是误把正的判断成反的,和误把反的判断成正的这两种错误。
这两种误判往往有着内在,不可调和的对立。当你试图减低其中一种误判的时候,往往不可避免要增加另一种误判的概率。比如,如果你把每一个嫌疑犯都判为有罪的话,你就不会漏掉真凶,但是你也很可能错杀不少无辜。反之你如果假设所有人都无罪的话,固然不会冤枉好人,但是也放过不少罪犯。
回到名校里不靠谱同学这个话题(原问题中的傻X一词还是过于重口味哈)。我们假设那些申请名校的人,或者说社会上,不靠谱的人本来就很多,比如95%的人都是不靠谱的。而名校的录取过程是为了尽量筛除这些不靠谱的人,留下那5% 靠谱的同学。但是名校的申请过程肯定是不完美的,比如会有以下情况:
靠谱同学被录取的概率:80%
不靠谱却被录取(admissions mistake)的概率:10%
靠谱同学的录取率是不靠谱同学录取率的8倍之多,按说这已经是一个不错的录取流程了。但是我们来看看结果。假设有1000人申请。根据刚才的假设,其中
1000 * 95% = 950 人是不靠谱的。
其中被录取的 950 * 10% = 95 人
而靠谱的同学数:
1000 * 5% = 50 人
其中被录取的:50 * 80% = 40 人
最后录取总人数:
95 + 40 = 135 人
其中不靠谱的人数占比:95 / 135 = 70%
而这是一个总录取比例仅有 13.5% (差不多是 Cornell 的水平),并且能够相当准确甄别靠谱与不靠谱申请者的学校。
所以,名校中也有大量不靠谱的人存在,只是浓度比社会均值低了一些而已。
其根本原因是名校再仔细的删选机制,也架不住潮水般的庞大的社会上的傻缺群体。虽然尽可能降低误判概率,但是那些漏网的傻缺也足以让名校中的靠谱同学稀释在茫茫的傻缺海洋中了。这也导致了回答开头所引用的费曼先生那句话。
另外,多学习基本的数学和统计学常识,受益终身。
大家可以设想另一个(非常真实的)例子。假设有一种罕见的绝症可以通过体检检查出来。正常人群中,这个绝症的发病率是 0.1%。如果你身怀该绝症,被查出的概率是 99.9%;如果你是健康的,却被误判成患有该绝症的概率是 0.1%(这也就是刚才说的 false positive)。按说这个检查已经是非常准确了。
假设你是一个普通人,体检中发现是阳性。你其实健康的概率是多少?
这里我就不具体推算了。计算方法跟刚才的 “名校傻缺” 同。结果是 50%。这不能算什么好消息,但至少还不是一个已经绝望的地步。在你决定把你的余生尽情挥霍和享乐之前,你至少应该再去测试一次。
不过这 50% 前提是 "你是一个普通人“。如果你是属于该疾病的高危人群,那么就不是这个结果了。这就涉及到 Bayesian statistics 中所说的 prior。而我们的整个推算也是遵循了 Bayesian statistics 的思维。这一切都没什么难的(楼下一位留言说是初中生可以理解的。我同意)。
但是据说美国曾经把上面这道有关假阳性的题考了考医生,大多数不能够正确解答。这说明了基本的数学和统计学知识是多么的欠缺,哪怕在受过高度教育的人中。
不要成为这样一个人。学好数学和统计学。
这可能在你人生的某个时刻,让你做出关乎生死存亡的正确决定。