Wednesday, March 11, 2009

BS Multi-regression BS

bs是从Newman那学来的:bullshit (废话,胡说)。话说上学期做termlong时,所有人精疲力尽的同时,无不感叹——作了这个才知道社会学,政策分析全是胡说。从此再也不能相信这玩意儿。

数据分析就别说了,乱七八糟的,根本没有什么趋势可言。为了有话可说只好到处找理由让任何变化make sense(可解释);

实地观察更是bs---因为这个区有5间废弃房屋那个区8间。走了128个区 能作出一个正态分布?然后煞有介事地说:你看,这边的几个区废弃房屋特别多阿,因为政府拨款少了!

可你不想想一个个区都是方方正正都有一样数目的房子?都面积一样?8个废弃的区也许房子小点但是比较多?4个的也许是整个区也就4间屋子全都被废弃了?怎么就能说8个废弃房屋的区就比4个的差了?没办法,为了写报告假装不知道啊不知道,还煞有介事的弄了个分布图出来。

这学期的multi-regression(多元回归)更是bs连天。举个例子啥叫多元回归分析:

工资=教育程度X+个人能力Y+家庭背景Z+U

这个方程说的是工资的高低到底由什么决定。教育程度能解释多少?个人能力能解释多少?家庭背景?

然后就说:哈,那个教育每增加一年,工资会长10%之类。貌似很有道理,做起来就知道也都是bs。

然后也要做个研究报告。本来想做美国的。结果美国的国家数据库复杂死了。我弄了半天愣没明白怎么调数据出来。问老师竟然说要写几段电脑程式才能调取数据。我不干!!于是跑到中国国家统计署调数据。我的妈呀,这个数据库真够简单的,连样本都没有。顺便搜索了下中文网页的类似研究做个背景调查,这才知道国内的多元回归分析有多烂:

一个清华的用教育投入来解释gdp(国民生产总值)增长,那个简单粗糙我都没法说了,还好意思什么r系数,f系数,置信区间说的一套一套的。“GDP从1980-2006年增长跟教育增长呈正比,所以教育投入挺能解释gdp增长的”——你说这不是bs是什么?虽然说gdp增长也许和教育有关,但你说1980年到现在的经济增长是因为教育投入大了???还能解释20%的增长?这不是简单粗糙是什么?你怎么知道不是gdp增长导致了教育投入增加?再说了,两个数字线性相关就说明它俩能互相解释了?

全是bs。读了就知道经济学,社会学跟文学创作是一样的。小样儿,穿件什么实证分析的马甲我就不认得你了?

2 comments:

Unknown said...

看来理论分折和实际是有很大的差距的。但有时为了达到某种目的,只能说废话啦。

Unknown said...

把理论和忽悠很好的结合起来,再加点数据,分析报告可能就很好看了。