计量经济学是伪科学吗?
- 3048 个点赞 👍
可以考虑如下几个假想场景:
1,你爸看不惯你经常撸串,他最近迷上了某档养生节目,准备按照专家的建议吃素。他想劝你一起加入,理由是吃素能长寿,证据是报纸上经常报道长寿和尚的故事,而和尚吃素,所以他得出结论:吃素能长寿。
点评:问你爸几个问题:报纸报道了长寿的和尚,对短命的和尚也有报道吗?你知道长寿的和尚占全体和尚的比例是多少?其他因素,比如遗传,有考虑吗?同样地,普通人的相关统计呢?是不是也要拉出来比一比?还有,吃素是只吃素,还是多吃素,还是存在某个黄金比例?有没有可能关系不是线性的,而是抛物线?超过或者少于某个最优值都不好?
你爸肯定回答不上来。别说计量了,你爸连最基本的统计学原理都没有学好。
2,你家楼上装修,你妈发现自从楼上装修以后,你家的天花板开始出现裂纹。你妈认为,正是楼上装修不当,损坏了你家的天花板,于是向有关部门投诉,要求楼上住户赔偿。有关部门的工作人员接到电话,上门勘察。经勘查,该工作人员认为,你家天花板出现裂纹,是因为你家房子使用年限较长,发生的自然折旧,与楼上装修无关,证据是他最近也接到了你家小区其他住户关于天花板裂纹的类似反馈。你妈不信服他的说法,理由是同一层楼其他住户,和自己住的一样久,并没有出现这个问题。你妈要求工作人员出示统计数字,以支持他「自然折旧」的论断,该工作人员的手机号码却再也联系不上。
点评:楼上装修,不必然导致你家天花板破裂;而别家也有天花板破裂的问题,亦不能推翻「邻居装修导致你家天花板破裂」的猜想。双方都不能说服对方的情况下,你妈要求工作人员提供更多统计数字,比如,有相似问题的另一家,是否也有邻居装修?显然是有助于发现症结的方法。找准对应的控制组和实验组很重要。该工作人员但凡有一点计量经济学基础,就能认识到自己给群众的答复是草率的。
3,你姐申请国外某名校的研究生没有成功,她明明很优秀,绩点高,还很早就加入了大牛的课题组,本科期间有不少研究项目经历。和她一起申请的好几个同学也没有被录取。她怀疑招生中存在种族歧视,于是向校方写信,要求调查。校方在回复中,向她展示了一组统计数字,数字反映,该校有好几个专业,跟历史相比,亚裔的录取率都上升了,因此,该校认为自己并不存在种族歧视的倾向。
点评:这个案例生动反映了简单统计的不靠谱,这也是我们为什么需要计量经济学的原因。哪怕每个专业亚裔录取率都在上升,总的亚裔录取率依然可能是下降的!因为我们不知道亚裔的申请的专业分布。举个例子,假设今年和去年都有100个亚裔申请该校,在去年,20人申请 A 专业,80人申请 B 专业,A 专业录取1人,B 专业录取19人,总计录取20人。在今年,80人申请 A专业,20人申请 B 专业,A 专业录取5人,B 专业录取14人,总计录取19人。总录取率下降,而你分开统计,两个专业亚裔录取率却都提高了。因为遗漏相关变量,忽视权重的影响,造成统计数字的不可靠,就叫辛普森悖论。辛普森悖论也正是田忌赛马为什么能赢的原因。
4,你的部门主管最近在推一个促销活动,主要通过向一部分用户发送附有折扣券的电子邮件。活动结束之后,你们发现这个月营业额显著上升了。于是,在有公司领导参加的工作总结会议上,你的主管开心地表示,这个促销活动非常有效。一向严谨的你却在会议上表达了自己的担忧,这个月的销量激增也可能和季节有关,要得出促销活动效果显著的结论,还需要统计用户打开邮件并下载折扣券的数字。来开会前,你私下向 IT 部门申请了这个数据,结果发现,真正打开促销邮件的客户,不到3%。你说完这番话以后,你发现部门主管面色铁青,刚刚还把主管夸奖一通的公司领导也满脸尴尬。一周之后,总部人员找你谈话,希望你在平时工作时,注意和团队其他成员保持良好关系。
点评:这个例子充分展现了学好计量经济学也是有很多副作用的。
5,你写的文章被抄袭了。这篇文章在你自己的公号不过百赞,在抄袭人的公号却突破了十几万赞,为抄袭人带来了一波不小的流量收入。当你的朋友告诉你这个消息,你感到非常气愤。于是,你联系了抄袭人,抄袭人却拒不承认抄袭的事实,还让你随便去告。为了维护自己的权益,你只好向法院提起诉讼。由于你平时的授权费用是5000元一篇文章,考虑到对方藉此获得了一笔商业收入,你要求对方向自己支付5%的收入分成,以及精神损失3800元,共计38000元。在庭审现场,对方承认了抄袭的事实,但表示,原文仅有百余点赞,数千的浏览量,根本不值原告所声称的费用。而自己获得的广告商业收入,投放商看重的是自己的品牌,而不是原告的文章。你方律师反驳了这种看法,认为原告之前和多家达成合作,说明其文章质量是受到市场认可的。而且,也不能仅从原告自己的公众号浏览量来判断文章价值。该浏览量不代表真实的传播量,很多传播量实际上是被抄袭方所窃取。读者会在朋友圈转发这篇文章是因为它的质量,如果不是原告的主张,他们并不知道这篇文章本来的出处。对于这种从不自己创作的抄袭号,你很难说它有什么品牌价值。
因为公众号文章授权纠纷在当地尚属首次,法院缺乏应对经验,目前这类无形资产的可靠的估值和定价模型也很少,所以法官无法确定流量收入和原文质量之间的因果关系,从而无法评估侵权行为的真实损害。法院不想增加自己的工作量,也为了保险起见,法院向当地报纸行业询问了稿费标准,最后按照千字500元的标准作出了判决,同时法院驳回了原告的其他请求。最终,侵权方向原告支付了2500元的赔偿。听到判决以后,你失声痛哭,表示这个判决不等于告诉大家,以后转载文章别走授权了,走授权要5000元,而直接抄袭只要2500元!
点评:建议未来法学院也应该加入计量经济学课程!
6,你上大学的弟弟发现这学期食堂的菜和饭的量都大幅减少了,牛肉面几乎没有牛肉,土豆排骨几乎都是土豆。于是,他向学校投诉。学校问他有没有证据,他便建议学校去调查全校学生开学初的体重和学期末的体重,从而证明食堂确实克扣学生的口粮,让大家的体重都下降了。学校对他的建议很重视,把食堂经理叫来了。但他没想到遇到了一个经济学专业毕业的食堂经理。经理说你搜集的那数据没用,因为你不知道如果大家都不在食堂吃的体重会是多少,只有知道这个体重,你才能算出食堂膳食是否有恶化。这个体重值不一定等于开学初的体重,因此,你用学期末的体重减去学期初的体重并没有道理。看着你弟弟无可奈何的样子,经理非常得意。
点评:幸好你弟弟晚上遇到了答主,答主悄悄递给了他一本书,叫《基本无害的计量经济学》,并叮嘱说,对付经理的方法,都在里面写着呢。
计量经济学正可以放在以上场景,用以排除各种混杂因素、认知偏误,使我们朝着变量之间更为干净的关系逼近。事实上,类似的场景还有很多,比如有人会从简单统计中得到「警察越多的地方,犯罪率越高」、「枪击案的幸存者中,头部中弹的少,四肢中弹的多,说明要加强对四肢的防护」等这类明显有问题的观点,这也可以通过计量方法或计量思想加以纠偏。
题主怀疑计量经济学是伪科学,那么我请问,你觉得在以上这些案例中,难道那些基于直觉、简单统计得出的观点,会更科学吗?
真诚赞赏,手留余香还没有人赞赏,快来当第一个赞赏的人吧!查看全文>>
星日马 - 112 个点赞 👍
老师回答的太好了。稍微谈谈我的看法。
这里的“伪科学”一词其实有不同的含义。它的确切含义是:本身并非科学但是假装自己是科学。
但是“科学”这个词在中国本身就是含义不清的,按照库恩等专门研究科学史的人,它有确切的含义,本身就是科学共同体所相信并采用的那些“范式”,但是在中国的语境下,科学这个词是有价值判断的,它指那些正确的、合理的、有用的东西,如“这不科学”。
如果这个更宽泛的语境,那么“伪科学”其实是看起来有用,实际并没有什么卵用的东西。这个星日马等各个大牛已经回答的很好了。
然而从第一个含义上看,就比较有趣。
拿微观计量里的“双重差分”而言,这个就是用科学术语包装起来的方法。因为从计量的角度,这个本质上就是一个交互项的回归,无所谓科学不科学。但是它的术语显得很科学,例如它有treatment group和control group,要估计一个treatment effect,还需要进行placebo test(安慰剂检验),这显然是医学上所谓的随机双盲对照实验的术语。
换句话说,这里完全符合“假装自己是科学”这一条。
而至于它本身是不是科学呢?实际上不一定。
例如应该是《世界经济》以前有过一篇论文,就对现在双重差分的使用提出了一些批判,如他们认为如果双重差分不满足分组的随机性和外生性,那么只能叫做“交互效应回归”,而不能叫做双重差分。
然而实际上分组是外生的这一条件很难达成,而双重差分可能只要求“平行趋势”等假设。如果分组不是外生的,通常采用匹配(如psm)的方法,使得分组近似“随机”,但即使这样处理,和医学上所谓的“随机对照实验”依然差别很大。
从这个意义上说,可能确实有“并非科学但假装科学”的现象。
但是换一个角度,如果分组不是随机的,难道我们就不对想要研究的现象采取更加细致的处理,而仅仅凭借经验和简单的相关性下结论吗?(如,对外投资能否提高企业的生产率,恐怕我们很难把企业随机分成两组,让一组企业去投资,另一组企业禁止投资)恐怕这时候仍然采用双重差分就是一个次优的选择,也就是这一现象的研究我们可能很难甚至无法做到“科学”,但是我们可以尽可能像科学近似。这是我们能找到的最正确,也是最有用的方法。
查看全文>>
改之理zcw - 0 个点赞 👍
查看全文>>
路边的陌生人