张雪春:大数据研究的政策价值

时间:2021-03-02
作者: 张雪春

大数据时代为实证研究提供了丰富的素材。有人认为所有经济现象皆可用数据来描述,大数据将对人文社会科学的研究范式产生变革性的影响,其中也包括经济学领域的重要分支——计量经济学。为了探讨大数据与计量经济学的关系,利用最前沿的方法论升宏观预测的精度,京东科技研究院于2021年1月26日召开了“大数据时代对计量经济学的影响”线上研讨会。

人民银行金融研究局副局长张雪春出席并发表演讲。张雪春认为利用大数据做出来的指标有望比传统指标更加及时、更加准确、更加贴近公众感受,而且实现及时政策预警的目的。

以下为发言全文:

我今天是抱着学习的心态来参会的,所以主要从宏观数据研究的角度讲几点大数据在我国经济研究中的应用。

我最早认识秦老师是在亚洲开发银行,后来再碰到是我加入人民银行研究局之后。在2012年前后,我跟秦老师合作,就温州民间借贷数据写了一篇文章,题目是“从温州民间借贷看民营企业的发展”。当时跟秦老师合作印象最深的就是,她一直强调数据处理和建模理念就是“让数据说话”。

我在人民银行负责过几年《金融研究》,对我国学术研究有一些了解,对宏观经济和政策研究也有一点体会。中国的宏观研究存在两大问题:一是我们用的都是西方经济学理论,这些理论的很多假设条件在中国不成立。这是我们做宏观研究被诟病的一个重要原因。二是数据。我们做研究时不仅要把80%以上的时间用于搜集和整理数据,而且很多数据(尤其是宏观数据)从定义、编制过程到方法等很多因素都在变。在中国做宏观经济金融研究非常不容易。从一个简单的方面就能看出来,在中国最好的大学,宏观经济领域的老师和教授比较少,因为发文章特别难。以上属于客观原因,主观方面也有些原因。不少宏观和微观经济研究的文章在数据处理上不够严谨,有的文章不断换模型和调参数,直到得出作者想要的结果,即使这些结果不稳定、不严谨甚至不正确,依然如此。所以,从中国宏观研究层面来看,我们面临着一些主观和客观问题,需要寻求突破。

近年,我国在大数据积累方面可能远远走在其他国家前面了,而且大数据对经济金融方面的研究正在产生革命性的影响。我觉得我们在经济金融学术理论、政策或者商业方面的研究,已经因为大数据的出现和应用宏观基础发生根本性变化。过去数据有限,计量模型都是建立在有限的抽样数据分布假设上。虽然DSGE等模型可以帮忙解释一些问题,但是,DSGE还是类似黑盒子模型,在中国宏观经济研究中发挥的作用有限。目前还没有在国内看到能够比较稳定地解释中国宏观经济的DSGE模型,也很少看到这方面特别有说服力的文章。有了大数据,就可以克服抽样偏差和抽样数据分布假设条件带来的局限性,让机器根据尽可能多的数据来分析我们感兴趣的变量以及导致这些变量发生变化的因素。

但是,并不是数据越多越好。现在到处都是数据,每天都比前一天有更多数据,但是,更多的数据并不一定是更好的数据,而且用更多的数据做出来的预测或者其它结果也不一定更接近事实。为了让大数据和相关结论更有价值,我特别同意秦老师的说法,即我们需要为特定目的设计、搜集正确的数据,也就是数据的质量要有保证。第二,需要寻找因果关系。很多文献分析了数据之间的因果关系,关联度很高的几组或者多组数据都不一定有因果关系。大数据并不能自动生成准确的预测结果。这就是为什么我们需要严谨的方法。如果没有正确的方法,海量数据出来的结论也可能是不严谨的,至少站不住脚。

近年,国际上又出现了一种“小数据”的说法。很多国家为在人工智能领域占领高地,都在加大计算能力、员工和数据的投入,计算机已经学会了很多原来我们不可想象的东西,比如识别物体、翻译语言和回答问题。现在,一个新的领域是开发出使用更少数据的方法,用小数据代替大数据。这个领域被称为“小样本学习”。德国的人工智能专家就在研究这些东西,主要目的是让计算机更接近于人脑,因为人脑不是从大量例子中学习的,不过这个领域目前多用于生物领域。对多数行业而言,人工智能的商业价值还是依赖大数据,学术和政策研究也是如此。我们要从大数据开始,到一定阶段后,可能达到秦老师所说的“大道至简”。

今天秦老师反思了传统计量模型的局限,对我最重要的启示是怎么在宏观经济的微观基础、工具和数据范围的含义发生革命性变化的情况下,用正确的方法做出准确的预测、分析或评估。这种方法论层面的变化具有高度的思想含义。

秦老师今天讲的主题是如何开展有效的预测,尤其是宏观预测。她主张要有目标、有导向地筛选变量,然后确定模型的形式进行预测,这种方法属于数据驱动型建模方式。这种方式容易被诟病,因为数据驱动往往意味着理论含义偏弱,而且模型包含的变量也可能发生变化,需要很好的故事来阐明这种方式得出的结果,或者需要提出新的理论来支持。另外,大数据里包括了很多非数值型的变量或者属性信息,它们的占比可能多于数值型数据,那么如何实现这类数据从微观到宏观的加总,是学术界或者专业人士面临的问题。

即使存在这些疑问或者不足,用现有方法和大数据做出来的有意义的宏观指标,还是可以超过传统指标。以通胀为例,可以用京东和阿里等企业的海量销售数据做出比统计局CPI更好的消费指标,因为大数据算出来的指标不仅可以克服抽样和抽样数据分布的局限性,而且如果我们有正确的方法,还可以克服零售消费交易中间的种种的偏差,做出来的指标比现有指标更加及时、更加准确、更加贴近公众感受。

周小川行长在去年12月发表过一篇文章,叫做《拓展通货膨胀的概念与度量》,也提到了这方面的问题。传统CPI之所以跟大家的感受存在差距,因为传统CPI在度量方面存在不足:一是缺少包含资产价格的因素。如果没有CPI里没有包含资产价格,那么感觉会带来一定程度的失真,尤其是长周期的比较会失真。二是用什么收入作为计算通胀的支出篮子。三是现有CPI指标里没有包含劳动付出的度量如何影响对通胀的感知。四是通胀比较的基准可比性和参照性。周小川行长提出要测量与公众感受接近的指标,就是要用CPI、劳动强度、休闲时间来校正真实收入,再用同等的收入衡量综合水平。他之所以这样提,是因为通胀是央行观察经济金融的一个变量,一个中间变量,不是终极变量。我们关注通胀是为了关注公众福祉,促进经济平稳运行的程度,改善公众对经济系统的稳定预期,所以通胀不是评价居民福利和经济运行的全部指标。

货币政策不仅要关注通胀,还应该关注通胀指标背后的体验,但这实际上带来更多问题。比如如果通胀包含了资产价格,那么央行要盯住这个指标,又没有应对资产价格变动的工具,在操作层面就会出现问题。不过,这些不是目前阶段大数据需要考虑的问题。从央行的角度出发,我们要判断通胀变化的原因是由短期供给造成的,还是需求因素造成的,是否有其它影响因素,哪些因素跟货币政策有关,我们是不是有适合的政策来应对。但是,如果京东算出来的指标比现有月度指标更及时、更准确,那就是一种很好的指标。如果能像秦老师说的那样,京东的宏观指标能反映一些微观指标的变化,并且把它们反映出来,及时做出政策预警,那么可能会具有政策含义。这类指标不仅有非常大的政策价值,也有很大的市场价值。

总结看,现在大数据的应用非常多,但是仍处于初步阶段,我们有很长的路要走。用大数据做宏观预测具有无穷的潜力,但是没有定论,取决于我们能做出什么东西,我们能在政策上做出什么反应,值得大家做更有意义的探讨。谢谢!