规避风险——让数据控制一切
在这样一场全民参与的“数据革命”中,各行各业都在发生深刻的改变,包括我们的思维方式。但与此同时,也引发了人们对于“数据暴政”的担忧。这同样是一个值得警惕的问题,尤其对于我们个人来说,怎样避免它的风险,并成为这个新世界的主人?
数据不管有多少,海量或是无限量,它仍然有一个极限点,无法到达也不可能统计出来。假如你将命运完全交给数据,它在量化你的同时,也会成为你命运的暴君。完全根据数据办事带来的负面效应,正是今天许多大数据学者所忧虑的,因为数据缺乏最珍贵的人性。人的判断和人性的特点,是枯燥和单一的数据不可能表现出来的。
比如一部上映于2002年的美国科幻大片《关键报告》,讲述了在未来技术先进到了警察可以阻止犯罪发生的程度——通过海量信息分析,在嫌疑人还没有犯罪之前就把他拘捕,以预防犯罪。至于怎么知道谁要犯罪,则由三个躺在水池里具有特异功能的人决定,他们能及时捕捉一些关键信息。这有点像美剧《疑犯追踪》中所描述的,数据告诉我们一个人即将做些什么事情。
但事实是,毕竟还没有发生,不是吗?人性最大的特点就在于不可预测性——预谋好的犯罪有可能终止;准备好的计划有可能终结;想做的事情突然不想做了……诸如此类,我们每个人都有很多这种临时放弃某件事的经历,这是数据意识不到的,也是无法判明的。
另一个悲情的例子是,华尔街证券市场曾经通过复杂的数学逻辑设计出来一套交易策略,但最终酿成了市场崩盘的结果。
美国科学作家莱特说:“科学的数据与对人的数据总有很大的区别,像天文、气象、传染病的研究资料,是经过科学家精心收集实验所得,它们是宝贵的资料;但对于人的研究资料,正像我们对人性所了解的那样,是多变和可逆转的,所以总是不太可靠。”
☆数据的“风险管理”——放到一个地方是危险的
在对数据进行管理的时候,要恪守一条定律:把全部数据都放在一个地方将承担最大的风险。就像你将自己所有的钱都存进了一张银行卡,而你又经常用这张卡在网上进行购物,也没有为自己的网银提供足够保护的话,你的这些钱随时可能不翼而飞。钱不能放在一个篮子,数据当然也是如此。
为了资金的安全,我们应该分开存储,而不是押宝一个篮子足够安全。比如,有些电话号码不能存进手机而是应放在秘密的本子里;身份证和银行卡要分别存放而不是放在同一个抽屉中。这有利于分散风险,假如你真的遭遇到了窃贼,你就明白这是多么重要。
对企业而言数据的安全性更为重要,像数值数据可以存储在数据库里,非结构化的数据则可以存储在文档或者表格里,进行针对性的管理,来分散风险的来源。我经常看到一些企业犯下低级的错误,他们在做完架构、设计、开发等所有的工作之后,才开始考虑安全问题,就像吃完了饭才发觉这顿饭是凉的,可能会伤肚子。这是非常大的错误,不能杜绝危险的发生,只能起到事后追补的效果。企业应该在开始之初就考虑数据的安全问题,来搭建安全的架构,对数据进行严密保护。
为数据建设一个铜墙铁壁般的房子只是安全的一个方面,为了保证数据的安全,企业还应该将数据切片进行存储,以此做到更为精确的控制。什么叫切片存储呢?就是只对单名员工开放部分数据的权限,只有两人或多人以上,才能查看到某一部分完整的数据。如此一来,就算有人侵入数据库盗用了这个部分,总体还是安全的,因为单一部分很难获得全部的信息,甚至有时一点作用都没有。没有上下文的数据对于窃取者来说可能意义不大,特别是当数据的价值密度很低时。
☆加密——消灭数据的“毒性”
有毒的数据我们称之为“毒数据”,这个词由费里斯特提出,被称为toxic data,意指企业手中掌握到的如果泄露出去就会对企业或个人造成巨大损失的数据。比如电信公司收集到的数据,其中会包括用户的通话时间、地点、移动轨迹等;社交网站收集到的数据包括用户的登录密码、发言和好友信息等;金融系统收集到的数据,则包括用户的消费记录或消费习惯等,用户的银行密码当然也包括在内了。
为了降低泄露这些数据的风险,对于它的加密就变得尤为关键。也就是说,数据必须被锁在一个完全可控的保险箱内,确保我们每个人都能成为这些信息的主人,而不是在它被泄露时无能为力,任由它成为一种“有毒物质”。
现在,大数据领域内最基本的做法是使用透明数据加密法,这一做法代表着对所有的捕获到的数据都进行加密,以此保证全部数据都具有同样高的安全性。虽然它的成本一度很高,但近几年来已逐渐变得可被中小企业接受。
另一方面,如果我们的生活全部由数据控制,甚至包括你的思想,会引发多么可怕的后果呢?现在,数据正以亦好亦坏的方式控制我们,而且已不断地证明人们比想象中还容易受到它的驾驭。
在它的控制之下,我们的生活正发生怎样的变化?
1.不受制约的数据收集,正大大地威胁到我们的隐私和自由,这是显而易见的一个负面作用。
2.数据控制一切还加剧了一个早已存在的风险:人们正越来越依赖数据,但它远远没有我们意想中的可靠。
当依靠数据的分析并不完全可靠时,我们可能会完全受限于分析的结果。一个错误的结果,却不会受到任何质疑,甚至还是堂而皇之地持久成为某种权威结论,继续加深人们对于数据的依赖和痴迷。最终,人们可能仅仅为了收集数据而去收集数据,或者赋予它根本无权得到的信任。
有一位经理人说:“我现在离开数据,就无法做出决策了,我像相信上帝一样相信它,除了上帝,任何人在我面前都必须用数据说话。”这是他的信仰,同时也是很多管理者和决策者所遵守的原则,所以这句话经常回荡在华尔街、中关村或者上海浦东的高档写字楼里。在我看来,他们都在为数据打工了,已成为数据的奴仆,让它控制了自己的灵魂与思考。
长此以往,后果将不堪设想。
最后,我们如何避免数据的这种独裁和垄断,也就是数据主宰一切的困局?我们怎样与它平等对话,灵活协商,而不是没有条件地言听计从?
在我看来,摆脱数据独裁的唯一办法,就是建立起一个可以持续的数据协商制度,这意味着把分析和使用数据的权力给予基层员工,让那些有一线经验的员工来判断信息的来源是否正确,来预见数据的分析是否合乎情理。
就像大数据的产生是由于技术的分工整合一样,使用数据的人也应该更好地分工协作,集思广益,比如让一群经过先进技术训练的数据专家共同来解决棘手的难题,让这些数据使用者承担起更多的责任,避免出现数据的独裁困局。
结论是:我们必须让数据说话,但是“钥匙”一定要掌握在人的手中。