大数据能让企业盈利吗

2014-11-16来源 : 互联网

大数据*了两年多了。有人认为,大数据理念把我们带入了一个**的时代——大数据时代,它已经或者说必将渗透到我们生活的方方面面,所有游戏规则将因大数据而改变。于是乎,许多企业开始躁动,大量资金都开始向大数据项目聚集。但是,企业界人士发现,大数据是雷声大雨点小,那些说得有声有色、清晰可见的大数据应用案例就像一片海市蜃楼,激动人心但触不可及。除了一些**公司的大数据案例被反复宣扬、炒作之外,制造业的大数据成功案例却少之又少,甚至很多企业界人士对于大数据的概念都还没有一个明确的认识。明眼人看得出来,其实热闹的场面多是大数据的设备供应商和服务商在鼓噪。很多人在问,大数据有那么神奇吗?今天我们的大多数企业是不是需要它?笔者用了一年多的时间,阅读了大量有关大数据的资料,采访了多位大数据**,并走访了一些大型企业,现在我们想对大数据提出以下质疑:

一、大数据究竟有多大?

大数据的概念一出,有不少人心里就犯嘀咕,为什么叫大数据?它和以前的数据究竟有什么不同?它究竟有多大?

其实,现在数据量的暴涨主要就是因为互联网和智能手机的出现,它们使数据的概念跳出了报表中的**伯数字,带来两类新的数据:结构型数据和非结构型数据。比如,我们在网上浏览了什么网页,搜索了哪些内容,发出了什么邮件这些都被定义为数据。我们在互联网上浏览和使用手机交流的一切行踪都以数据的形式被记录下来,新的数据挖掘技术,可以利用这些数据来分析我们的一举一动,寻找其中可以利用的规律,挖掘其中的商业价值。这样的数据收集其数量相对于过去的数据采集来说是非常大的。那么,这些数据大到什么程度呢?是不是足够反映我们的行为规律呢?

掌握更多的数据对于人类科学来说是一种进步,因为那有助于我们认识客观世界。比如,我们在学习解析几何的时候,要在坐标系内平滑地、准确地划出一条函数曲线,我们得到的曲线坐标越多越好。同样,在我们认识这个世界中各种事物发展变化的客观规律的时候,拥有越多的数据,我们的认识就越接近客观实际。那么,今天所谓的大数据与客观世界的真实状态的差距到底有多大呢?

举一个例子,由于摄像技术的进步,我们**可以对一条2公里长的公路作全程录像监控。如果一个摄像头的监视范围是200米,我们至少要安装10组摄像头。所谓录像就是每秒钟拍摄30幅画面,这样,**24小时,10组摄像头**要拍摄两千多万幅画面,一年下来,这个数字不可谓不大。但是,现实中我们不可能这样做,即使录制了这些画面,我们也不可能长期大量保存这些数据。因为那样成本太高。所以,我们只能在关键地点设置摄像头,采集其中的一部分数据。正是因为这个原因,我们经常会眼睁睁地看着犯罪分子走出监控录像的视线范围消失。有**这样形象地描述我们现在的数据收集:我们身边已经产生并且可以收集到的数据就像倾盆大雨,企业的大数据收集工作只不过是制作了一只木桶去接雨水,没有接到的和因为木桶满了溢出去的数据很多很多。即使是这些接收到的很少的数据,我们实际用到了多少呢?有**透露:研究人员只是从收集到的数据中提取了1%的数据进行分析。而就是这1%被分析的数据支配了目前的大数据创新,被称为“大数据”。

所以,就目前的情况看,今天所谓的“大数据”其实并不大,与反映客观事物的真实数据还有很大的差距。依靠这些数据分析出来的事物变化规律只能说相对过去的抽样分析要准确一些。因此,我们不能迷信大数据的分析结论。

《大数据时代》的作者维克托·迈尔—舍恩伯格认为, “人们处理的数据从样本数据变成全部数据”的结论至少从目前的数据收集和分析能力来说是不可能实现的。

还有这样一句话在提醒我们:没有不变的真理,只有客观规律。规律是不断变化的,任何数据集和数据模型都不可能找出一个不变的规律。所以,再大的数据也不能**准确地找出令人迷信的规律。

二、 大数据能让企业**吗?

有**认为,大数据只是提出了一个从数据中获取知识的方法。这个方法好不好是一回事,当下它可行不可行是另一回事。对于企业界来说,所谓可行就是能够**。一家企业的老总对CIO说,我可以给你资金搞大数据,但是你能不能告诉我,上马这个大数据项目,一年后或几年后会有什么结果?CIO坦率地说,我很难告诉你。

现在不少人有这样一种理念:“如果我们拥有了足够多的数据,我们肯定会得到我们想要的结果。”其实,来源于互联网、传感器、流数据库、社会网络等方面的数据具有多样性和差异性,非常复杂,许多数据形式、结构都不同,有些数据甚至互相矛盾。要去除不相关的数据很难。因此,数据分析的结果一定会有各种误差。而可怕的是,错误的分析结果带来的损失可能是毁灭性的。如果我们不问因果,只按照大数据的指引做企业决策,风险是可想而知的。

大数据带来的**营销让我们看到了广告成本的降低、营销效率的提高。但与此同时,我们也看到,数据从采集、存储到分析都是要花*的,收集、存储数据的成本很高,分析数据的成本更高。所谓数据分析,是数据分析师提出假设,然后使用工具去证实(或者是否定)这些假设。因为依赖的是假设,这种方法就存在着人为的局限性。

《“原始数据”只是一种修辞》一书中说,数据从来都不可能是“原始”的,数据总是依照某人的倾向和价值观念而被构建出来的。数据分析的结果看似客观公正,但其实价值选择贯穿了从构建到解读的全过程。所以,数据分析师的分析成果也是从其自身的判断出发的,必然带有局限性,这里的误判概率是很大的。

现在,上马大数据项目,动则数百万元,一个数据挖掘项目至少也要几十万元,而且数据挖掘项目不是一劳永逸的。一位数据公司的老总私下说,一个数据挖掘项目结束后,我们把模型交给客户,是一次性付费的。但市场规律可能会发生变化,一旦模型出现偏差就不能再按原来的方案使用这个模型了,必须请我们的数据**对模型进行调整,而调整工作是需要客户另付费的。所以,对于数据挖掘的投资企业必须要有一个清醒的认识。

大数据应用要真正在企业落地生根、开花结果,还有很多工作要做。就像人类有了钢铁,还要造出机器,还有很多的知识要学习,不是有了数据就可以了解世界。企业必须了解业务人员的需要,再请数据分析师帮助解决问题。否则,盲目上马大数据项目不一定能够**,也许你只是为自己的企业画了一个未来十年看上去很大的“饼”。

三、大数据的分析真的很准吗?

《黑天鹅:如何应对不可知的未来》一书的作者纳西姆·塔勒布提出,随着我们掌握的数据越来越多,可以发现统计上显著的相关关系也就越来越多。这些相关关系中,有很多都是没有实际意义的,在真正解决问题时很可能将人引入歧途。这种欺骗性会随着数据的增多而呈指数级地增长。在这个数据的海洋里,我们要找的那根“针”会越沉越深。

大数据时代所呈现的一个特征是,科学研究实际需要的数据有可能被人们收集的海量数据所淹没。曾利用大数据成功预测了2012年美国总统选举结果的**Nate Silver警告说,企业决策者应该对大数据的概念和应用保持谨慎,否则很可能导致一些错误的决策。

谷歌成功预测流感的案例给人印象深刻。其运作原理是:通过分析谷歌的搜索查询数据,来跟踪人群中的流感状病例。但是,2009年,H1N1流行伊始,谷歌模型严重低估了流感病例的数量,迫使该系统不得不修改算法。2013年,谷歌“流感指数”又大大高估了流感的峰值水平。而与此同时,美国疾控中心也与“Flu Near You”展开同样的合作,最终的结果却是——在同一时间点,三方拿出的数据相差甚远。这时,说不出原因的大数据将人们推到了尴尬的境地。

其实,谷歌的两次指数错误都是由于流感新闻大爆炸,导致搜索行为失真。而在sickweather的地图中,大城市上空永远笼罩“疾病云”,而少有人上网的乡村就显得数据匮乏,其结果就导致了数据失真。可见,数据很多时候是不可靠的,甚至有可能使人误入歧途。

再比如,当你在亚马逊网站上浏览和购物时,亚马逊会利用你浏览和购物的特点来搜索在他们的资料中与你类似的消费者的购物记录,并把他们购买的商品向你推荐,因为他们假定你们购买同类产品是因为你们很大程度上有共同的爱好,而共同爱好就决定了他们购买的商品很可能你也需要。这种建立在概率的基础上的推断,其准确性是很差的。

所以,《纽约时报》的文章也认为:数据不懂社交、不懂背景,会制造出更多噪音,遗漏真正有价值的东西,大数据无法解决大问题。

维克托·迈尔—舍恩伯格认为,“人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相互联系。这一切代表着人类告别总是试图了解世界运转方式背后深层原因的态度,而走向仅仅需要弄清现象之间的联系以及利用这些信息来解决问题。”这个观点似乎让我们放弃对科学原理的探寻,而一切听从数据分析家们的猜测。这就好像让我们闭上眼睛,一切感觉求助于手里的一根棍子。其实,大数据得出的结论并不比人类长期实践探索得到的经验更准确。

而更可怕的是,大数据看不到那些“沉默的信息”,因为它们不会提供任何数据。有这样一个故事:第二次世界大战中,美国哥伦比亚大学的沃德教授应军方要求,利用统计学分析“飞机应该如何加强防护,才能降低被炮*击落的几率”的问题。他针对联军返航的轰炸机受伤的情况进行研究发现:机翼是被击中最多的位置,机尾则是最少被击中的位置。沃德教授的结论是“我们应该强化机尾的防护”,而军方指挥官认为“应该加强机翼的防护,因为这是最容易被击中的位置”。沃德教授解释说:第一,统计的样本,只涵盖平安返回的轰炸机;第二,被多次击中机翼的轰炸机,似乎还是能够安全返航的;第三,在机尾的位置,很少发现弹孔的原因不是不会中弹,而是一旦中弹,其安全返航的几率就微乎其微。军方采纳了沃德教授的建议,并且后来证实该决策是正确的,看不见的弹痕却最致命!这个故事的启示是,没有返航的飞机无法提供数据,所以弹痕数据的来源本身就有严重的偏误。也就是说,在日常生活中,有很多收集不到的数据,但它们非常重要,起着决定性的作用。

四、 大数据能绕过“隐私权”吗?

美国《连线》杂志创始人凯文·凯利有一段名言:“如果需要个性化服务,就必须用透明度换取。最大化的个性化意味着最大化的透明化。如果不想透露任何信息,那就不能期待别人把自己当作有个性的个体。”很显然,个性化的服务需要对每个人的深入了解,如果做不到这一点,任何服务都缺乏针对性。换句话说,就是要想得到对胃口的服务,就得让人家了解你,牺牲一些隐私。实际上,在大数据时代,你透明的程度已经不取决于你了,你已经被大数据监控和记录了。

最近,有一句经典的话在流传,忘记“老大哥”( BIG BROTHER)吧,现在监测着全世界的是“大数据”( BIG DATA)。这句话来自这样一段历史: BIG BROTHER,直译成汉语是“老大哥”的意思,出自乔治·奥威尔的名著《1984》。《1984》是一部幻想小说,出版于1949年,当时描述的是“未来的”1984年的社会现状。在小说里,乔治·奥威尔描述了这样一个情形:一个无时无刻、无所不在的“老大哥”监视着所有人的一举一动,无论是吃饭、睡觉、工作或者走在街上、躲进洞穴———包括思想活动。每个人都被“老大哥”注视着,而且,每个人实际上都将成为“老大哥”的“眼睛”。

2000年,英国出了一档电视娱乐节目叫《BIG BROTHER》,电视台召集一些年轻男女,把他们放到一个四处布满摄像头的公寓里,拍摄他们的生活然后剪辑播放。与此同时,在电脑技术领域,出现了一款同名软件,功能为“系统监视”。这一切都演绎着《1984》里的一个经典场景:“老大哥在看着你!”

在大数据时代,无处不在的数据采集系统使每个人都是赤裸裸的,没有隐私,无处可藏。甚至掌握大量数据的分析系统比你更了解你自己。早在1999年,Sun Microsystems前CEO斯科特·麦克尼利就说过:“你没有隐私,忘记这事吧”。

在大数据时代,数据分析师们可以根据科学或者他们喜欢的运算法则为混沌的数据创造秩序,进行深度挖掘,揭示出新的模式。但是,丰富的数据、深入的分析使他们越来越接近人们的生活细节,甚至接触到了人们的隐私。这引起了多数人的反感。纽约一家广告公司的研究表明,75%的人不希望企业储存他们的个人信息,几乎90%的人反对企业跟踪他们的网络浏览记录。

不仅如此,互联网哲学家叶夫根尼·莫罗佐夫警告大家,将会出现“算法的独裁”。他说,随着算法公式越来越多地应用于金融和预防犯罪,应由独立、有资质的人员来掌握和分析它们,以免造成权力的滥用。向《卫报》披露美国政府监视民众文件的爱德华·斯诺登说:“我并不视自己为英雄。因为我所做的事情关乎自己的利益。我不想生活在一个没有隐私的世界,这将无法推动知识的探索和创新。”

库克耶和舍恩伯格也认识到了大数据理论的一些内在瑕疵。最近他们撰写的《大数据的兴起》一文表示,大数据是一种资源和工具,它的目的是告知,而不是解释;它意在促进理解,但可能导致误解,关键在于人们对它的掌握程度。他们认为,人们必须用一种不仅欣赏其力量、而且承认其局限的态度来接纳大数据。

五、 大数据会不会扭曲人性?

英国**作家王尔德说,我可以抵御任何力量,除了诱惑。大数据的商业价值就在于,当它了解了消费者的行为规律和兴趣爱好的时候,就会利用这些来诱惑消费者。

**投资大师索罗斯有一个反身性理论,是说:人的行动由人的认识决定,同时人的认识又受客观世界的影响,而客观世界与人们的行为紧密相关。所以,人的行为对人的认识又有反作用。如果大数据通过人们的行为规律去诱导人们的认识,将使人们的认识发生扭曲。同时,人都有逆反心理,就是人们彼此之间为了维护自尊,而对对方的要求采取相反的态度和言行的一种心理状态。当人们了解了大数据环境的诱导技巧,必然会产生逆反心理。使人们的生活常常发生失常的现象。

如果你去赴一个很私密的约会,路上遇到一个人,他看着你的眼睛,说出你要到哪里去,你要去见谁,要谈什么事。你会不会很惊讶地说:“你怎么知道的?”继而产生一种极强烈的反感?请淡化这种情绪吧!大数据时代,这种情况会很多的,因为大数据把你分析得极为透彻。每个人的行为规律、性格爱好都有据可查,而且非常准确。

总有**,你面对的世界可能会是这样的:当你走在一条街上时,前面的商家会根据大数据的提示,知道你要来了,并且知道你大概什么时候路过他的商店,你的爱好是什么,你现在想要什么,于是,当你路过时,商店的橱窗可能因你而改变。如果每一家商店都这样做,你面前的世界一定是“想要什么来什么”,在你得到满足之余,会不会有一种“总是被人看透”的感觉。

你的行为规律已经被大数据看透,它按照你过去的生活规律诱导你现在、甚至未来的生活,你会不会有单调乏味的感觉呢?我们应该以好奇心面对未来。然而,在大数据时代,人们很难有什么好奇心了,因为未来掌握在大数据的手里。

大自然的美妙在于未知,人类社会的魅力在于探索,知与未知之间就是人们追求的空间。所以,人的自由思维空间是必不可少的。有人提出,大数据时代还要不要科学家呢?学会了深度学习的机器能够独立搞科研吗?其实,“大数据重要,直觉也不可或缺。”这是一次业界会议的主题。人类不能失去独立的、灵活的思维方式,世界就是在无法判断的神秘变幻中演化的,世界的奇妙就在于莫不可测。

不要让人类思维的美好世界扭曲为大数据的冰冷轨道。

1.“有了足够的数据,数字就可以自己说话”——不可能。

数据集——不管它们具有什么样的规模——仍然是人类设计的产物。当大数据试图反映人们所生活的社会化世界时,这些因素变得尤其重要,而人们却常常会傻乎乎地认为这些结果总是要比人为的意见来得客观些。偏见和盲区存在于大数据中,就像它们存在于个人的感觉和经验中一样。

2.“大数据将使我们的城市变得更加智能和高效”——在一定程度上是的。

数据在生成或采集的过程并不都是平等的,大数据集存在“信号问题”——即某些民众和社区被忽略或未得到充分代表,这被称为数据黑暗地带或阴影区域。因此大数据在城市规划中的应用在很大程度上取决于市政官员对数据及其局限性的了解。

3.“大数据对不同的社会群体不会厚此薄彼” ——几乎不是这样。

对大数据所号称的客观性的另一个期待是对于少数群体的歧视将会减少,因为原始数据总是不含社会偏见的,这使得分析可以在整体水平上进行,从而避免基于群体的歧视。然而,由于大数据能够作出有关群体不同行为方式的论断,它们的使用通常恰恰就是为了实现一个目的——即把不同的个体归入不同的群体中。

4.“大数据是匿名的,因此它不会侵犯我们的隐私”——这个观点大错特错。

尽管许多大数据的提供者尽力消除以人类为对象的数据集中的个体身份,但身份重新被确认的风险仍然很大。人们在城市中走过的路径存在唯一性,而鉴于利用大量公共数据集可以推断很多信息,这使个人隐私成为“日益严重的担忧”。目前被出售给分析公司的医疗数据有可能被用来追查到你的身份。高度个人化的大数据集将成为黑客或泄露者觊觎的主要目标。

标签: 企业管理

联系电话:023-62873158      地址:重庆市渝北区金州大道94号财富森林2幢

增值电信业务经营许可证:渝B2-20120016 渝ICP备11000776号-1 北京动力在线为本站提供CDN加速服务

Copyright©2004-2019 3158.CN. All Rights Reserved 重庆叁壹伍捌信息技术有限公司 版权所有

3158招商加盟网友情提示:投资有风险,选择需谨慎