“珞珈质量指数”的表现形态就是大数据,但是这一指数的全部价值就等于“数据”吗?答案是否定的。
大数据时代的到来,当然是革命性的,但数据本身是与人类文明一起诞生的,即使是大数据,也没有改变数据这一基本的传统。
7年前,我院刚开始做质量竞争力的数据分析时,尤其是我院5年前开始做质量统计与分析时,我就发现,数据并不像我们想象的那么客观和正确,也就是说,数据可能会将人引入歧途。比如,当时有一个衡量质量竞争力的指标,是每百万元产值的专利数量,也就是说专利数量越多,你的竞争力越强。然而事实是怎样的呢?恰恰相反,单个专利所产生的市场价值量越大,专利的价值才越大,这就意味着一个专利如果能获得100亿的销售,那毫无疑问这个专利是非常有价值的,而如果一个企业拥有100个专利,所产生的市场价值只有100万,可以很明确的判断这些专利的数量是毫无价值的,甚至可能就是一些垃圾专利。但是,在这个统计分析中,拥有100个专利的单位反而竞争力更强。
以上的分析只是为了说明一个最简单的道理,数据本身并不能自动地反映一个事物的状态,更不能直接反映一个事物内在的规律和本质。因为,如何统计数据,如何判断数据,实际上都需要人的参与。我再举一个质量监督合格率的例子:很多人认为它是一个客观上反映了产品质量的数据,稍加分析,就知道这个说法非常不靠谱。首先,合格指标就是由人来设定,而不同的人对指标的取舍显然是不一样的,专家和老百姓对中国乳制品标准的巨大分歧就反映了这个道理。其次,多少是合格,也是一个由人来定义的概念,不同的条件下,人们可以设定不同的量级指标。最后,不同性质的产品也会有不同的评价指标,比如飞机的指标可能要接近100,而一件服装的指标则没有必要。可见数据要反映问题,要能够挖掘出数据背后的相关性和逻辑关系,是需要靠人的大脑去做的,只有人的思想才能利用好数据。
数据的本质到底是什么?数据的本质是要反映思想,就是能产生新的思想。
我们院在做今年质量观测报告的时候,数据量当然非常大,但这些数据说明了什么问题,起初让我们几乎一筹莫展。当时,我们不仅没有获得大数据所带来的红利,反而陷入了数据的困境之中,因为这些庞大的数据量到底说明了什么,反映了中国质量怎样的年度状况,这些数据本身并“不会说话”。现在,我们发布的年度观测报告之所以会有如此强烈的社会反响,绝对不是来自于这些表面的“大数据”数量,而是我们从这些“大数据”当中,提炼出了反映质量状况的思想,比如“中国质量安全出现向好的根本性逆转”,再比如“我国质量的主要矛盾已经从质量安全转向了质量满意”,还有如“产品和服务的微观质量与中国经济发展明显正相关”等等,就是这些“大数据”的思想表达,也正是因为这些思想的表达,才引起了各界强烈的反响。湖北省委李鸿忠书记,前天在我们院所提交的“关于湖北经济社会发展质量研究的报告”上(这个报告就是建立在大量的数据基础上),批示“所提的4条建议很好”。请注意,决策者并没有说这些数据很好,而是说反映这些数据的思想很好,这些思想就是具体的4个观点和建议。
我们院一直在做质量大数据,但我始终在警醒自己的,就是数据要有思想,不能为数据而数据。明确地讲,我对目前质量大数据研究的状况有很大的危机感,危机之一就是很多人只是简单的对数据进行统计,而这些数据相互之间到底有什么关联性,有什么内在的逻辑性,却完全不能解释,你所看到的仅仅是一堆原料,甚至你都不知道这些原料能够拼装出一个什么样的东西出来;危机之二就是只是摆弄数据游戏,看起来计算过程非常复杂,建模也非常漂亮,但说明的却是再简单不过的道理,也就是已经早就被人证明过的常识;危机之三就是缺乏对数据的驾驭和处理能力,不能从数据中提炼出新的发现和新的观点,也就是缺乏数据的灵魂,缺乏数据的思想爆发力。这就是很多人,包括一些在读的博士,甚至包括很多专业老师,之所以做不出好研究的原因,那就是只有“数据量”,没有“思想力”。
什么是数据的“思想力”呢?一是要从数据中有新的发现,哪怕这个发现只是某个局部现象的科学反映,或者只是对一个小问题的新的解释和发现,总而言之,必须从数据中提炼出新解释和新观点;二是数据是对一个事物定量的反映,要通过这些定量的数据挖掘出事物的本质,事物的逻辑性和事物的内在规律,定量必须能够定性;三是要建立起数据相互之间的关联性,这种关联同样包括数据之间的因果关系。一个好的数据分析,一定是能提炼出令人耳目一新的思想和观点,一定是能够找到数据背后的内在逻辑性,一定是能够通过数据有新的发现。
大数据是干什么的呢?大数据是用来证明新的思想和观点的,也就是说,在当今复杂的社会经济生态环境下,一个人不能仅仅靠聪明或天赋去发现一个新的现象,而只能通过大数据的挖掘才能发现新的现象和提出新的思想。没有大数据的验证,所谓新的思想,就只能是一个假设,而不能称其为是能被证明的新的发现和理论。
我们院所推出的“珞珈质量指数”,绝对不是表面上的一堆数据,而是要从数据中提炼出具有创新性的质量思想和科研成果。具体来说,就是要解释中国的年度质量到底发生了什么样的变化,这些变化的原因是什么,各个区域是因为什么因素而导致了质量水平的差异?尤其是,这些数据反映了什么样的质量科学内涵,能不能表现出质量发展的新趋势?只有这些“思想力”的内容,才是我们“珞珈质量指数”的真正价值之所在。
“珞珈质量指数”的价值是思想,也只能是思想。
“珞珈质量指数”的核心思想是什么,有哪些新的思想和新的发现?且听下回分解。