龙源期刊网 http://www.qikan.com.cn 大数据及大数据应用经典案例分析 作者:刘倩倩 来源:《科技风》2018年第27期 摘 要:本文从介绍大数据及分析大数据应用经典案例,分别是淘宝数据魔方的应用、Netfilx用大数据捧火美剧《纸牌屋》、辛辛那提动物园与IBM合作应用Cognos Business Intelligence s商业智能等不用领域的应用,来介绍大数据应用方面的相关案例,并得出相关启示。 关键词:大数据;案例分析;联系 在计算机发展越来越快的今天,网络信息技术已经成为人们生活中重要的一部分。衣食住行等各方面常常都用到网络,比如人们的网络购物、去某个旅游景点的出行安排、观看哪部电影电视剧等,我们不仅是生活在如今的信息时代,也是一个由无穷无尽的数据组成的时代,随着成千上万的人的各种行为活动产生的数据,政府、企业、商家等通过一定的数据应用技术,来促进着社会的不断发展。本文将通过五个案例来详细地了解一下这些大数据应用的具体情况。 1 大数据 对于大数据的定义国际社会尚无统一定论,常用对大数据的定义是指利用常用的软件及工具捕获、管理和处理数据中所耗时间超过可承受时间的数据集,是互联网发展到一定阶段的产物,对于它的定义,国际社会提出过“3V”、“4V”等定义,在“4V”基础上,增加了“Veracity”变为“5V”定义,即:Volume,Variety,Velocity,Value,Veracity。这5个方面代表大数据的5种不同方面特点,分别为:数据量庞大(Volume)、数据种类丰富(Variety),数据速率快(Velocity),数据价值高(Value),要求真实性(Veracity)。由此5种特点而组成的大数据,与云计算和物联网等新兴技术共同作用下,人类数据量与数据种类爆发式增长,打破了以往数据库的限制,通过互联网即可对世界任何一个角落的数据进行挖掘、分析和利用,对人类社会具有颠覆性的影响,一方面,大数据推动了数据的管理与检索,如果将之前的数据集比作池塘,那大数据就是一片大海,数据量巨大,并且通过不同方法可以达到不同的效果。另一方面,数据猛增,对数据的真实性和个人数据安全进行了更加严格的要求。 2 大数据应用经典案例分析 2.1 Netflix用大数据捧红美剧纸牌屋 通常而言,影视影视投资是具有较大的风险,就过去经验而言,电影的票房与投资回报率、电视剧的收视率、都是很难预测的,但美国影视公司的一部电视剧——新版纸牌屋龙源期刊网 http://www.qikan.com.cn (House of Cards”,被称作是基于大数据分析,进行创作、拍摄,从剧本主题的选择,到导演演员的选择,拍摄和后期制作,都是经过大数据分析得出来的结论。Netflix公司提前一年时间运用大数据对用户的观看习惯,进行分析指导影视节目制作。 2.2 淘宝数据魔方 众所周知,在淘宝网迅猛发展的今天,淘宝网不仅获得了经济价值,还拥有着不可估量的潜在价值。海量的数据里潜藏的经济价值,为淘宝的决策、发展提供了重要的依据。每天有数十亿的各种商品浏览记录、上千万的收藏、成交、评价记录,帮助淘宝、商家借助大数据背后重要线索、规律开展运营,帮助消费者进行理性的购物决策,是至关重要的。 在淘宝运用的三种数据分析工具:量子统计、淘宝指数、数据魔方中,本文将介绍数据魔方这一典型的应用案例。 淘宝数据产品的技术框架,通过对数据的流向来划分,可以把分为数据源、计算层、存储层、查询层和产品层等五层结构(如图1所示),数据源层包括主战备库、RAC、主站日志等,处于数据产品技术的顶层,计算层对实时流数据进行计算,然后在存储层进行存储,用户通过搜索、查询、浏览等也可生成一系列原始数据。根据对这些数据的收集、整理,数据魔方可以了解到用户的偏好、購物习惯等,这些数据中蕴含着巨大的商业价值。 2.3 辛辛那提动植物园与IBM 辛辛那提动物园是最早提出全球动物保护的机构,在动物繁殖学领域中的突破性调研取得了优异的成绩,为全球物种保护起到了非常重要的作用。作为美国最受欢迎的动物园以及一所非营利性组织,动植物园除了一部分资金来自于地方政府,但每年三分之二的预算需通过自筹来运营。如果保证动植物园的良好运行,辛辛那提动植物园与IBM合作,运用多年来入园客户数据的累积分析,茹日常销售的数据,商品的购买时间、购买类型、购买数量等了解到了动植物园的发展趋势,管理层依据这些数据优化决策开展运用,动植物园的销售额得到大幅提升。 3 结语 通过一系列的应用案例我们可以得到一些启发:政府与企业可以通过聘请专家,培养大数据专业人才;全面科学地收集整理数据,进行集中式存储;购买使用科学创新数据驱动的产品,保证收集到的数据真实有效、便于利用;建立数据中心,对收集整理的数据进行科学的分析,从而得到数据中蕴含的巨大的经济价值与社会价值。 参考文献: 龙源期刊网 http://www.qikan.com.cn [1]埃丝特·戴森.大数据利弊之辩[J].中国经济报告,2013(06):23-24. [2]赵春雷,乔治·纳汉.“大数据”时代的计算机信息处理技术[J].世界科学,2012(02):30-31. 作者简介:刘倩倩(1988-),女,汉族,吉林四平人,硕士,助理馆员,毕业于长春理工大学。 本文来源:https://www.wddqw.com/doc/82eda65aa06925c52cc58bd63186bceb19e8ed2b.html