全部版块 我的主页
论坛 休闲区 十二区 休闲灌水
754 0
2015-12-23
引言

曾经有一个故事广为流传,故事很短也很有意思。做人力资源管理的默默负责招聘数据分析师,在面对要进入最后一轮的人时,她只说了一句:“我叫默默,有什么事,可以问我。”当时,她还不知道,就是这一句话,让她对大数据有了新的认识。

几天过后,最后一轮面试开始了。一个看起来斯文的男生拿着一叠材料,非常认真的介绍自己如何胜任这个职位。他交上来的材料,让默默大吃一惊。封面上赫然写着“默默女士调查报告”。报告不厚,只有十几页,但关于默默的兴趣爱好、常去的地方、最关注的人(经常@的人)、亲密圈子(互相关注的博友)、经常谈论的话题以及网络话题以及网络口头禅等等,在报告中被一一用数据、图表展现出来。

默默呆了几秒钟,内心翻江倒海。因为,这份报告描绘出的她,既熟悉又陌生。“难道我最爱吃的是麻辣香锅,3月内提及这个词汇10次?难道我如此渴望得到某个人的回应?3个月内@了他12次?难道,一个素未谋面的小伙子,比自己更加了解自己?”默默陷入深思。这就是大数据的威力——比你自己更了解你自己,让你的隐私无所遁形。很多时候,许多隐藏在电脑背后的庞大数据就像一个麻乱的大线团,只需要找到那个线头一拎,就能再现一个个的网络人格,一个连你都不知道的自己。

何为大数据?

人、机、物三元世界的高度融合引发了数据规模的爆炸式增长和数据规模的高度复杂化,世界已进入网络化的大数据时代。近年来大数据的飙升主要还是来自日常生活,特别是互联网公司的服务,百度每天大约要处理几十PB的数据,淘宝网会员超过3.7亿,在线商品超过8.8亿,每天交易数千万笔,产生约20TB数据。传感网和物联网的蓬勃发展是大数据的又一推动力。然而,大数据的本质不只在于它的大,而在于它的全。通过多维度,多角度记录一个世界或者一个人的真相和行为轨迹。

最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。

大数据时代的三大规律规律一:知其然而不必知其所以然 外行打败内行

电影《点球成金》,讲到一个球队教练遇到了一个经济学家,他们用很另类的方法,也就是使用数据,把每一个选手的场上记录拿过来,用数据去找,看谁是好的球星,这跟传统的行规完全不一样,但是后来非常成功。

《点石成金》是电影,有演绎的成分,然后在现实生活中也有这么个人,以同样的手法在玩转NBA。他就是火箭队的总经理达雷尔·莫雷,他是一个年纪轻轻、几乎没有打过球、没有当过教练、也没有过专职球探经历的家伙,这么一个人,他的表现可谓跌破了全美专家们的眼睛。莫雷成为正真意义上第一个将数据带入篮球领域的人。刚开始,休斯敦人纷纷指责莫雷放弃杰伦·戴维斯和约什·麦克罗伯茨,而用26号签选中身高只有1.80米的后卫亚隆·布鲁克斯,结果布鲁克斯在夏季联赛中的表现令所有人瞠目结舌,他压倒了包括榜眼凯文·杜兰特在内的诸多新秀,成为夏季联赛中表现最突出的新人,并当选官方夏季联赛的“最佳新秀”。火箭队今赛季的表现也非常抢眼,目前,越来越多的NBA球队开始用数据来经营管理自己的球队。

原先,老师经常教导我们,要知其然,还要知其所以然。但是现在大数据时代,你可以知道其然,不一定非要知其所以然。如果我们有机会去问莫雷一些专业的篮球术语,他可能不知道,可是他就能通过数据分析,从联盟中选择出出色的球员,从这一点来看,莫雷这个门外汉做的并不比那些专业人士差。

在我们的认知里头,每当一件事情发生时,我们总爱探求其背后的原因,这是好事,好奇心推动事物不断向前发展。但当我们执意去寻找一些线性的、双边的直接因果关系时,我们却跑偏了,因为事物之间的联系比我们想象中的要复杂,他可能是非线性的,可能是多元的,更可能是一个系统。所以与其积极的寻求事物之间的因果关系,不如先搞清事物之间的相关关系。

规律二:彻底的价格歧视 商家比你更了解你自己

《纽约时报》上曾发表了一篇文章,文章主要讲述了零售商连锁店塔吉特(Target)利用上百万的交易记录(以及婴儿产品用户注册信息)推论,那些购买无香型婴儿沐浴露之类产品的消费者可能多数处于怀孕状态。公司根据历史交易记录,给预计正怀孕的消费者发放婴儿用品优惠券。其中一个消费者的父亲看到了大吃一惊,要求公司给个解释,后来却发现,这家掌握着用户购买数据的公司居然发现了自己女儿的秘密,而她至今还没找到合适机会向父亲说明。

经济学上讲价格歧视(按不同的价格出售不同单位的产量)可以提高企业的利润。在现实生活中,我们也常常碰到价格歧视,当往往是三级价格歧视,即厂商对不同的人按不同的价格出售产品,但卖给特定个人的每单位产量却按相同的价格出售,这样的例子有对老年公民的折让优惠,对学生的折扣优惠等等。为什么厂商不采用更高级别的价格歧视,获取更高的利润,不是因为道义上不能,而是由于在过去商家很难对不同的顾客,进行价格歧视,你必须要定统一的价格。但是大数据时代来了,情况就有所不同,厂商可能比你自己更了解你的行为,它可以精确的针对每个消费者制定价格。

规律三:打破专家的信息优势

专家之所以成为专家是因为他懂得比我们多,可是在大数据时代,我们跟专家“掌握”的信息差不多。原来我们生病的时候,只能去找医生,因为只有他懂,可是现在不一样了,我们把症状在谷歌里一搜,马上就能诊断出来了;学习也会变得更加简单,网上资源丰富,很多学习过程可以在学校以外进行,这一切都会削弱学校和教师的重要性。大数据时代,完全颠覆了原来信息不对称的情况,于是乎,“专家”越来越少,“砖家”越来越多。

大数据带来的风险:用你的隐私去赚钱

大数据是一座巨大的金矿,具有巨大的商业价值,给我们带来各种各样的好处,但这里头也有风险的。你害怕不害怕你的隐私被别人拿走?大数据的前提就是你必须把你的隐私要全部贡献出来。各大企业从浩瀚的半结构或非结构化数据宝藏中获得有价值的信息,这些数据大部分源于人和传感器,包括用户上网浏览的资料、社交网络上用户的信息和评论、传感器数据和监视数据等。虽然有的数据表面上看并不是个人数据,但经由大数据处理之后就可以追溯到个人。由于巨大的利益驱动,各大企业无限制的收集、处理、使用个人信息,还有许多大企业之间或企业与第三方间共享用户的信息。如此情况,不可避免的给用户带来了风险:个人隐私泄露的频繁发生,威胁到了个人的生活安全,也成为了影响社会治安的主要因素。

那么,在大数据时代,我们的隐私是怎么泄露出去的呢?

大数据时代,人人都是名侦探柯南

犯罪分子总以为自己的犯罪活动隐藏的很好,不会被人发现,然而柯南总能发现常人忽略的细节。柯南通过罪犯的整个行为轨迹,在现场以及在其他时空里留下的蛛丝马迹来判断真相,包括嫌犯说过的话、不经意间的举动等等,通过大量的信息冗余去校正信息,最后发现事情的真相,因为真相只有一个!

我们一直是靠这种方式来判断世界的,只不过原来没有这么丰富的信息记录工具罢了。大数据时代来了,我们可以轻而易举的得到有关事务的数据,通过信息的交叉形成对真相的判断。人人都可以像柯南一样,发现事情真相。

信息的交叉复现

过去银行要贷款给客户,又怕客户不可靠,出现坏账,所以银行会做大量的调查来判断这个人是否可信。这样兴师动众,不仅花费大量的人力物力,消耗大量的成本,结果可能还是不可靠,因为客户可能会隐藏对自己不利的信息。大数据时代来,问题变得简单了,也许只需要知道客户的姓名、住址、电话、公司、工资卡号就可以了。通过住址,我们可以判断他的居住环境以及消费水平;通过公司,我们可以判断他的工资水平;通过工资卡号,我们可以判断是否有违约出现等等,通过不同维度的信息的交叉复现,我们就可以判断这个人是否可靠。所有的信用判别,要用大数据的方法,它的成本会低的不像话。

也许我们很小心,很注意隐私的保护,把一些信息及时删除,但是你没有注意到其他多维信息仍然在出卖你。

我们处于时刻的监视中

当我们逛淘宝、京东时,各大购物网站监视着我们的购物习惯;当我们聊QQ、刷微博、发邮件时,网络公司会监视我们的社交关系网;智能手机可以随时定位,我们去哪都会有人知道;脱离这些智能设备,我们出去走走吧,各大活动场所、商店、小区等监视着我们的出入行为;越来越流行的可穿戴设备,比如说小米手环,可以监视我们人体内的活动,例如心率、活动量等等。

现在我们的生活普遍用某种设备存储数据,通过手机、电脑,每年我们都会产生大量的数据,这部分数据被称为“元数据”,这是我们自己通过数据往来一点一滴建立的。虽然大部分不会永久保存,而且对你没有什么直接影响,但是所有数据都会透露有关你的某些信息。

小处不可随便

更为糟糕的是防不胜防,有些我们认为不重要的信息,会利用交叉验证、交叉复现的原理,把我们想刻意隐藏的真相给暴露出来。更多的情况是我们压根就没注意到隐私的泄密。当我们在安装APP时,总会有一个提示:这个软件会调用你的通话记录、短信、WiFi、地址可不可以?可是我们有多少人会把这段话看完呢?

会当凌绝顶,一览众山小

以上所说的还是在数据充分但不完全的情况下,如果有一天到全息可见程度,只要你站的高,有足够的视野,你看到的真相不仅全而且真。

人肉搜索分分钟让你倒挂城门

如果你认为互联网是一个虚拟世界,假设我们匿名参与、及时删除不用的信息以及把有用的信息加密,我们的隐私就不会泄露了。那你的想法就太天真了,你只不过没有引起众怒罢了,但若不小心在这原本平静的池塘里搅了一下,瞬间会引来多人的围观,甚至你将在短短时间内被网民揭开层层面具,然后将你毫无保留地挂于网络世界最显眼的城门口示众。在中国有个非常形象的词汇来形容这一行为——人肉搜索。当艺人被“人肉搜索”之后,比扒光衣服站在舞台上跳艳舞还恐怖。

不知道现在你对隐私保护还存不存有幻想,也许这就是我们将要面对的“赤裸裸的未来”。有人把隐私保护比作一次绝望的守城,要我说啊,我们哪有城啊,我们只有一个人,面对的是实力雄厚,所有的力量都调动起来的企业和个人,他们不断地去搜集、探听我们的隐私。诚然,我们有保护隐私的欲望,可是我们不也经常泄露自己的隐私吗?我们的隐私还保护得住吗?如果真要保护隐私,只有一种办法了,那就是找个深山老林,过上刀耕火种的生活,前提是你不被别人发现。

    在大数据时代,我们每个人都是赤条条地在信息社会中裸奔,真的是光着屁股一丝不挂地那种裸奔。未来众多领域的信息会置于阳光下,确实堪称“赤裸裸的未来”。我们该感到忧虑,但不应该过分担心,因为未来并不是一团漆黑。

大数据时代的光明社交媒体仅仅是一个平台

大数据分析泄露或滥用了个人用户的数据,这么说不能认为完全错误,但至少是不客观的。社交媒体仅仅是一个平台,它的出现给了我们一个发声的机会,满足了我们分享的欲望。单从我们个人来说,我们是获益的,因为我们分享出来的并不是见不得人的东西,恰恰是我们希望别人看到并评论的。所以这是一种无声的默许行为,我们乐意把我们的生活琐事暴露出来,而社交媒体从这嘈杂的数据中进行有序的分类和分析,这没什么不妥。

当然,如果社交媒体肆意泄露和滥用我们的后台数据,比如我们的姓名、家庭住址、银行卡号等隐秘信息,这当然是犯罪行为,必将受到深深地谴责与法律制裁。

企业以服务消费者获益

各大企业之所以积极搜集用户的信息,实现精准营销。是因为人们渐渐意识到,每个个体的行为也许不尽相同,但仍有规律可循。通过获取与分析海量数据,我们能够获得用来分析人们行为习惯的有效信息,从而使得我们具备对个体行为进行推测的可能。

如今各大互联网大佬都在跑马圈地,圈住用户,谁能圈住用户,让用户在其平台上活跃,谁就掌握了用户的大量信息(包括显在的前台信息和隐藏的后台信息)。阿里巴巴斥资入股新浪微博,就有大数据营销这方面的考量,阿里巴巴有用户的购买信息,但却没有完整的用户日常生活行为信息,而新浪微博恰好能弥补这方面的不足。以后阿里巴巴可以针对不同的人群进行精准营销活动。我们并不是真的讨厌精准营销,试想推送的产品与我们的需求相关,或者是我们恰好需要的,这就省去我们很多麻烦,给我们带来便利。

我们也是大数据的受益者

大数据并不是强者欺凌弱者的工具,因为大数据是开放的,在未来,会向消费者和其他普通人开放,我们也可以查询我们所需要的数据。我们所有的数据,首先是我们自己的,因为是经由我们个人行为创建的。不是一种负担,而是我们拥有并能够使用的资产。这些数据将帮助我们活的更健康,更清晰的了解我们自我,在更短的时间内实现人生目标。如果善加利用,个人数据将成为我们的一项能力。

随着时代的变化而变化,大数据来势汹汹,不可逆转。裸奔时代,我们的选择很明确:要么自己使用数据,要么由他人代劳。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群