“相关度高不一定是因果联系,非因果联系不一定没有用。”
这话本来是我总结出来的,可后来我才知道 萨缪尔森 的《经济学》是居然有这句话的前半句,唉可惜了,要是早生几十年就好了。
说这个的目的,1 为了提醒大家注意因果联系,2 就是注意,即使是因果联系,也要看谁是因谁是果。3 就是,对于非因果联系,有时候也是有用的。
比如说A是原因,B和C是同一个原因引起的两个现象,那么,B=k*A,C=h*A,这样一来,C=(h/k)*B,似乎B成了C的原因。
我在某著名大学出的教科书上看到了个例子,说中国的税收和居民存款的增长有正相关。近十年居民存款一直在增加,税收也在增加。
然后下面就给出一四个解释,看得我很无奈 。
尤其是第四点解释:随着中国经济的增长,人民生活水平也同步提高,经济增长导致增税收增加,人民生活水平提高导致存款余额增加。
我那叫一个汗啊。这是标准的伪线性回归问题啊。
至于非因果联系的有用性,可以用Google搜索一下 “股市指数值看上去是与赢得超级杯的做揽球联盟相关联的”这句话,在找到的图书的第380页。
美国股市的涨跌与超级碗的哪支球队赢球的相关度非常高,你能说它是因果联系吗?但它又是很有用的,对吧?