Tag Archives: Joke

学术帖:从概率统计论角度分析为什么“情侣去过某某地或者送过某某东西就一定会分手”的说法这么准?

摘要

本文从学术角度严肃探讨了“情侣之间送过某某东西或者去过某某地就一定会分手”等等说法看上去很准的原因,为广大情侣们摆脱困扰,合理开展增进感情的活动提供了理论依据。

正文

最近很多说法在互联网上流行,比如“一起坐摩天轮的恋人最终会以分手告终”,“情侣去过紫竹院的和送过石头记的一定会分手”[1]等等,每次此种言论后均有大量回复证明此看法的准确性(虽然也有少数反对声音)。实际上,这种说法是没有统计学上的依据的。

定理1: 若全社会平均每个人的谈恋爱次数大于2,则分手的情侣一定比最后在一起的情侣多。

定理1的另一种表述是,若社会总体分手率大于50%,则分手的情侣一定比最后在一起的情侣多。而实际上,资料显示情侣分手率高达80%[2]。(因此以frequentists派的观点来看,根据极大似然估计,对任何一对情侣,我们都应该预言其以分手告终。为避免被情侣们追杀,本文对此不作展开)

定理2: 任何事件(即“去过某某地”或“送过某某东西”等),只要不与“情侣分手”这一事件成很强的负相关[3],这种预言就总是看上去很准确的(比如,准确率>50%)。

设“去过某某地”这一事件为a,“分手”这一事件为b,P(b|a)即为预言的准确率。我们首先考虑相关性为0的情况,此时P(a,b)=P(a)P(b),则P(b|a)=P(a,b)/P(a)=P(a)P(b)/P(a)=P(b),可见,在相关性为0的情况下,预言的准确率仅与P(b),即全部情侣总的先验分手概率有关。而据上文所述,P(b)=80%>50%,P(b|a)这个预言就给人以很准确的假象。

进一步地,在相关性非0的情况下,我们还可以求出一个阈值theta,任何与b相关性大于theta的事件,P(b|a)发生的概率都大于50%。因为公式稍繁琐,在这里就不作推导了。

[附注:如果要发Paper的话,下面这段解释应删除]
其实用大白话来讲就是,就算你啥都不管,它的概率就已经是80%了,那么你尽可以提一些莫名其妙的无关情况(即事件发生的相关性为0),它准确性当然还是很高。实际上,坐不坐摩天轮和分不分手之间根本就没有关联,坐了的也是80%分手,没坐的也是80%分手,你找10个坐了的出来,里面就有8个是分手的,它当然看上去就准确了。这种情况的一个极端是,我预言“所有今天吃米饭的人一百年后都会死”,这准确性基本100%,但这是因为一百年后会死的概率本来就是100%,跟吃不吃米饭没啥关系。

下面总结一下设计这样一条预言应遵循的原则:
1. 事件b的先验概率应该足够大(比如,情侣分手率)
2. 事件a不能与b成强负相关(比如“已经订了婚的情侣一定会分手”这就不太靠谱了)
3. 为了更具迷惑性,事件a最好不要与b成强正相关(比如“每天吵架的情侣一定会分手”这预言虽然没错,但别人兴趣也不会很大,只会觉得你在说废话),而应该与b没有相关性(比如本文开始的例子),这样就会给人以神奇的感觉。
4. 为了更具广泛性,事件a应该选择很多人会做的事(比如情侣之间送什么东西),这样才能使得你的预言被广泛传播(要是说“一起登过火星的情侣一定会分手”估计没人理你的)

参考文献
[1]http://www.douban.com/group/topic/4939331/
[2]http://news.163.com/06/0704/01/2L5ABBL200011229.html
[3]http://en.wikipedia.org/wiki/Correlation

Note: This paper will appear on Special Interest Group on Lovers Retrieval (SIGLR) 2009.

圣诞节说个小笑话

刚来天大的第一年,英语系的迎新晚会,几个学长学姐表演英文短剧,演的就是耶稣诞生这一段。刚结婚的玛丽亚把自己”感孕”的事情告诉丈夫约瑟,约瑟无奈地对天长叹:O my God, you gave me such a big green hat!