“大数据恐慌”这个话题,我想好已有十多天了。但由于某些原因,继“断更”16天之后于4月20日发了一次神经,又再次“便秘”了十余天。然而“某些原因”是什么呢?我自己也说不清楚。

幸而有各位朋友的温暖关心,唤醒我沉睡的勤奋,也令我十分感动。有人给我发信息,问我是太忙了还是生病了,为什么这么久没更新。更有人说,每天看微信里的很多文章,绝大部分都是复制粘贴毫无新意,只有我写得最好,所以最爱读。我也答应从五一之后恢复更新。但是不守信的我,又食言了:五一加班过后,和同事吃饭,虽然happy,终究耽误了太多时间,错过了晚间12点的最后机会。

在这个基本信任欠缺的国度,人们常常感受不到起码的存在感,因此安全感成为稀缺资源。年轻人谈恋爱需要安全感,上班族挣薪水养家糊口需要安全感,老年人看病吃药需要安全感,就连高高在上的政府,也时常缺乏安全感。这不,时值五一小长假,虽然我忙于工作没怎么出门,我用脚趾都能想到,各处的安检一定比平时严格了许多。

无论是个人还是组织,都是缺什么才喊什么。社会不和谐,才建设和谐社会;社会不稳定,才斥巨资维稳。曾经和朋友坐地铁,他问我最讨厌地铁什么,我说当然是安检,他由衷地会心苦笑。我也和同事谈到地域的差异,同样的机场安检,首都机场板着面孔的安检员就像机器人一样缺乏人情味,而地方小机场就总是人性化很多。

“万米单元格城市管理系统”曾经被树为城市管理的典范,它代表城市的“天眼”数量要以万米为单元,而今天公安、交通、小区、楼宇、商场甚至家庭的各种监控摄像头,早已星罗棋布,“万米单元格”恐怕已成昨日黄花。作为个人,早就无所谓隐私,漫说多年前人们的信件要被拆看、人们的电话要被监听,今天你甚至随便在哪里会个友、吃个饭,也被政府和各种有耻无耻的商业机构悉数掌握。

前些天微信上流行一个简单小游戏,说测测你上辈子是干什么的。只要简单地输入我的姓名,它就告诉我,我前世是丞相。同样的,某女友是女皇,某男生是秀才,而其他小伙伴则是贵妃云云,还有名妓上榜其中。大家觉得这是个简单好玩的事,无非给无趣的生活增添点谈资,仅此而已。但是朋友圈有人转发惊恐万状的“警世之言”:千万不要上那些阴谋家的当,他们原本只能知道你的微信号,当你输入姓名之后,他们就可以与真实姓名、电话号码对应起来,你的隐私就暴露无遗了。

理论上,这样说也没什么错。其正确性可谓很高,严密程度就相当于:你千万不要住高楼哟,你最好要住平房,因为地震的时候,你可以跑得更快。所以这类说法本身,恰恰是唯恐天下不乱的阴谋论。

严格说来,随着信息技术的发展,我们的生活工作的每一个细节都已经被数据化。且不说我们的户籍信息、教育经历、医疗健康、买房买车等个人信息早就存放在各种系统中,也不说我们的电话号码、家庭住址、入职离职、兴趣爱好被各种系统收录,即使是我们自以为随便走走的惬意生活,也照例被作为数据样本进入各种统计分析之中。举例来说,当你在商场享受shopping的快乐时,你的一举一动都被厂商记录在案,他们掌握你去了哪里、看了什么、买了什么,甚至你买一条毛巾之前看了七条、摸了三条、最后选购其中某一条这种你自己都不记得的细节,他们都有可能掌握到数据库中。

即使你十分恐慌,你宁愿去过某些族群倡导的简单生活,你去荒无人烟的世外桃园刀耕火种——且不说地球上是否还存在这样的所在——你仍然也逃脱不了被跟踪。天上有人造地球卫星,山上有移动运营商的基站,云中还有穿梭不息的飞行器,而山里的孩子必定向往外面的世界——总之,作为群居动物的人类,无论作为个体还是作为种群,都不可能独立存在。

其实,人们大可不必恐慌。虽然我们的很多个人信息都被别人掌握,但是我们应该相信,我们每个人在人性上是自私的,对他人的信息并无兴趣,而在技术上,掌握我们信息的人也没有必要和可能去关心每一个个体。在大数据分析的统计学意义上,真正有意义的数据是分类/分群关联数据,而不是某个具体个体的数据;在技术处理的时候,往往还有“脱敏”的过程,让涉及隐私的细节被过滤掉。

当然,不法商贩将个人信息进行贩卖以图私利,这本身是违法行为,虽不堪其忧,终不足为虑。另一方面,假若你干了坏事,在今天的大数据时代要追踪你,那确实比从前的任何时代都便捷许多。这其实也是告诫你,还是作一个好人吧,半夜不会有大数据恐慌的噩梦。

bigdata_panic