“大数据”不是万能的 (作者为清华大学新闻与传播学院教授、博导) 自2011年,西方有关“大数据”(big data)的理论像旋风一样席卷知识界。大数据正在成为一股热潮,不仅是IT业的技术革新,也在不断冲击政治、商业、社会和其他科技诸多领域。对其模式的思考,以及如何应用它,已成为新一轮技术变革的最强音。但是,大数据技术也有两面性。 大数据是巨量资料、浩瀚信息的另种称呼,实际是上世纪80年代末盛行一时的信息爆炸的同义语。从积极方面说,大数据确实已成为数据王国的主线,是下一步信息研究的主要对象。大众媒体、社交媒体和各个经济和社会领域如何使用大数据,正确评估大数据的商业价值,建立大数据的新兴产业,培育大数据的专业人员,将极大推动社会变革和经济发展。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。” 虚拟世界有取之不尽的资源,数据可以转化为资产和财富。每天各种机构、每个人和大量传媒发散的图片、文档、视频和言论杂乱无章、周而复始,人类早已无法掌控。而这些信息正是人类活动的真实记录,大量来自人类的心理层面和社会组织的内幕,通过大数据分析,人类完全有可能认识复杂、隐秘的社会和自然现象,使科学研究进入快速发展时期,过去的不可知领域可能将被人类彻底解开谜底。 从消极方面看,大数据技术不是万能的,不能解决一切问题,它只是决策的一种量化手段。正确认识事物的是非和利害,遵循人文精神是更为重要的前提。缺少这个前提,大数据不仅毫无用处,而且能为谬论寻求支持的数据。有的文章说:“大数据的时代其实是弘扬理性精神的时代„„美国在这方面就做得好很多,美国政府在各个领域都用数据分析,用数据决策,用数据创新。”美国确实重视数据,研究社会问题都搞民意测验或其他实证调查,已有80多年的传统。但2008年金融危机已过去5年,它的各种经济决策没有使其走出困境;它的情报部门搜集的许多数据都是虚假的(例如伊拉克有大规模杀伤性武器、向国际原子能机构提供虚假情报等)。尽管有大量脑库提供佐证与数据,美国历届政府都有重大失误。美国盖洛普民意调查所预测美国大选,每次通常搜集、分析十多万个数据,但多次预测出现错误。大数据本身不完全等于理性,决策基于数据分析而并非基于经验和直觉,是一种理性的表现,但更大的理性是人文法则。即重视人民的普遍要求,维护各民族的尊严和文化,尊重人的自由、平等和权利。不尊重其他民族的历史和风俗,奉行种族歧视,只知道本国利益而不考虑他国利益,在某些国际事务中实行双重标准,让美国政府在内政外交中屡屡受挫,给一些国家的老百姓造成不可弥补的伤害(例如多次对外战争滥杀平民)。 遵循社会(国际)公德、人道主义、公正与正义、平等互利等友善原则,是分析数据的指导性准则。数据是有类别的,它真实与否,对全社会是否有利,哪种意见是绝大多数人拥护、赞成的,赞成的人是哪个阶层等等,数据本身还存在一定的模糊性。对社会问题提取大数据,主要了解绝大多数人的意见,依据人民是否满意做出结论,但大数据与人民的数量绝非完全等同。新闻传媒反映主流舆论,做出正确而精准的报道,仅仅依赖数据还远远不够。 互联网、大众传媒和社交媒体每天提供的巨量信息有大量冗余、虚假和有害的内容,其中侵犯他人隐私权、生存权和精神健康权的信息与图像大肆泛滥,“价值密度较低”。人类不但不能把大数据一股脑地当作宝库,而且要冷静审视数据的两面性,抛弃有害和无用的信息,使数据分析立于价值和法律层面,避免浪费专业人员的时间和精力。 机器储存和分析难以囊括几十亿兆数据,即使储存了这些数据,专业人员也无法全部调阅,删除和忘掉无价值的、不相关的信息是处理大数据的重要原则。正如迈尔恩伯格在《删除:数字时代遗忘的美德》一书中所说,数字技术和全球网络压倒一切,使我们忘记自己的自然能力,我们必须重新恢复忘记。人类应采取的措施是“数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化”。“大数据的取舍之道,就是把有意义的留下来,把无意义的去掉。只有理解了在大数据中,需要的是什么,以及如何判断这种需要,才能举一反三地明白到底为什么要去掉那些不需要的。” 本文来源:https://www.wddqw.com/doc/f4dd107b8e9951e79b8927be.html