中国经济问题毫无疑问是全球经济学界分析和研究的热点和重点。大家都想从中国的经济发展过程中找到重大的发现,不管是理论上的,还是实证意义上的,也都认为这里面理所当然有大量这样的机遇。其实理论上的重大发现常常也来自于对现实发展问题的观察,这种观察的理性有赖于对案例的深刻剖析,更多的可能来自对于社会经济生活中各种变量在截面、时间序列上,又或者是面板层面上的仔细解析。这样,如果研究者手头得到的各种变量的数据存在这样或者那样的缺失,就会影响经验判断的准确性。如果数据出现不同方面的错误,那就更可能使得研究的结论与实际情况背道而驰了。
不幸的是,我们在利用国内公开出版的所谓官方数据进行实证分析的时候,常常在不经意的时候发现这些数据之中存有的内在缺陷。有些是显著不可调和的误差,有些数据甚至在逻辑意义上是自相矛盾的。数据的误差和缺陷常常可以利用各种统计工具进行修正和弥补,统计学和计量经济学的发展也使得这种工作相对更加容易。然而,那些相左的变量却常常使得既定的研究目标再无法实现,有时让学者们不得不忍痛割爱,即使这一选题看起来异常新颖而且重要。研究我国区域问题的学者就常常会遇到这样的问题。比如各个省的GDP加总起来与国家统计局公布的全国GDP数据相比,即使使用当期价格,两个总量之间随着年份的不同也总是存在5%到10%的误差,如果使用全国和各省公布的GDP指数进行平减,获得以某一年份为基期的不变价格数据,更会发现两者之间的差距可能扩大到20%-30%的程度,这种差异无疑会让研究者感到沮丧。如果研究其他国家的区域经济问题,如美国和欧盟,你会发现美国各州GDP加总起来与其全国GDP数据基本一致,欧盟各成员国公布的GDP数据加总起来与整个欧盟公布的总数也大致相当。即使两者之间有些差距,统计部门会进行相应的调整。而我国统计部门对国内这种区域加总和全国数据的巨大差别虽然给出了各种解释,如有统计误差的原因,有重复计算的问题,当然也有人为因素的干扰等等,但是却始终没有采取办法对两者进行调和,任由这种差别暴露在众人面前,成为质疑我国统计数据和统计体系的靶子。更为严重的是,不管是为了获得地方和全国的GDP数据,还是地方和全国的就业数据,为了所谓的监督和识别,中央和地方使用两套不同的数据产生系统,采用不一致的数据源来建立这些变量的统计数据,造成的统计数据不协调不说,也不知浪费了多少宝贵的公共资源。
没有准确的数据,真的让很多期望致力于中国问题研究的学者们难为无米之炊,即使有很多学者在降低数据质量要求的基础上做出了一系列有关中国发展问题的研究,但这些成果可能都经不起时间的检验。再有,有多少学者和多少学术资源浪费在讨论中国GDP的真实性、中国就业数据的可靠性等本来可以或多或少避免的问题上。不再带着数据质量的镣铐跳舞,可能是很多以实证为主要分析工具的中国问题学者的热切期望,也是真切探索中国问题,并提出正确的对策建议的根本前提,但是也的确有很长的路要走。