搞数据的人都清楚,最大的难题不是数据多、数据杂、数据质量不好,而是:根本就没有数据!书面一点说,数据的存在性是第一位的,及时性、有效性、准确性、一致性等等,都是在基础数据具备的前提下,才有讨论的意义。

不幸的是,我们中国的企业,业务和管理往往相当粗放,大量基础数据是缺失的。甚至是,“按道理”系统中“应该”保存的某些数据,可事实上就是没有、或有时有有时没有。我的数据模型师就多次向我抱怨,数据量太小、部分时点数据缺失,预测模型实在难以建立,更遑论让模型具有自学习、自适应的能力。

这决不是个别现象。多年以前,我做航空公司的项目时,就发现一个普遍规律:在一个行业中,大量重要的基础数据,核心厂商无法掌握,却被下游渠道商、甚至第三方公司拿走。航空公司相当于生产航空服务产品的制造商,机票往往是代理公司销售的,航空公司不知道谁是它的顾客。通过建设常旅客系统,并推进直销和电子渠道,今天的航空公司已经相当多地掌握了顾客信息,而不再是被代理公司所控制、被中航信这种流氓公司所垄断。如果你经常飞来飞去,你上飞机时空姐能够亲切地用你的姓氏向你问好,你应该感谢航空公司这些年来的艰苦努力。

一些更传统的行业,数据化经营的基础还要更差。例如服装制造商,只要不是国际一线大品牌,通常IT基础都比较薄弱。于是,一线导购只能采用传统方式手工填写销售单,并带领顾客到商场的收银台交钱。一天下来,自己的销售情况如何?需要商场的系统来告诉她。我亲眼看见他们采用时尚却落后的管理方式:傍晚,门店将销售量和销售额从商场的系统中读出,写在纸上,拍成照片通过微信群向其上级报告。这时候,导购或店长写在纸上的数字,由于各种原因与真实数据并不见得一致;管理层如果需要了解竞品的销售情况,则需要门店通过搞关系的方式从商场的系统中“偷”出来。

理想情况下,制造商应该建立自己的系统,并与商场的系统自动对接。然而关键在于,话语权究竟由谁掌控。对于商场央求着开店的国际一线品牌,一方面它自然有自己的IT系统,一方面由于话语权主动,想要获取的信息也能够得到更好的保障。但对于大量国内品牌来说,情形却是反过来的。比如在王府井商场,一般的服装品牌、家电品牌,是没有资格与王府井讨价还价的。

从产业链来说,这种模式就进入管理上的悖论:渠道商或零售商由于品类繁多,管理的粒度、数据的及时性通常不够好,理论上什么数据都有,实践上却缺失大量基础数据;制造商希望更具体地了解消费者的需求、掌握产品库存结构和销售趋势,以便按照消费者细分群体来提供精准营销服务,却没有足够的数据来支撑。

谁来负责打通产业链?需要行业龙头来打破僵局。但目前,困难仍然很多。你兴冲冲买一台彩电回家,花了几千元、上万元,安装的时候,工人却要向你再收取区区20元、30元支架费,你是不是体验很差?但是电视厂商很冤枉,这钱并不能装入它的腰包;安装服务商也很苦恼,它若不收这点费用而是自己承担,微利的它们实在承受不起。

在目前的商业格局下,大型零售商占据产业链主导话语权,因此类似这样的跨链条整合问题,应该由零售商牵头。令人欣喜的是,我们看到已经有一些负责任的零售商在行动。在上面的案例中,你能找到某些情况下,工人在安装彩电时不会收取安装费用。

对于跨行业的企业集团来说,整合产业链本来就是义不容辞的责任。例如,金融集团可以从你买车的行为中发现你车险的需求,从你存款记录中发现你的理财需求,从你公司的经营状况中发现你的贷款需求。类似地,横跨商业地产、零售百货、影院、旅游等不同行业的万达集团,正在试图通过统一的360度客户视图,挖掘更多商业机会。

嗯,正如老话说的:现实很骨感,理想很丰满。有理由期待,中国各行业的基础数据状况一定会越来越好。这样,我的模型师就能全心全意、意在必得、得意洋洋地闷头当他的数据科学家了。

where_is_data_from