数据从哪里来?

搞数据的人都清楚,最大的难题不是数据多、数据杂、数据质量不好,而是:根本就没有数据!书面一点说,数据的存在性是第一位的,及时性、有效性、准确性、一致性等等,都是在基础数据具备的前提下,才有讨论的意义。 不幸的是,我们中国的企业,业务和管理往往相当粗放,大量基础数据是缺失的。甚至是,“按道理”系统中“应该”保存的某些数据,可事实上就是没有、或有时有有时没有。我的数据模型师就多次向我抱怨,数据量太小、部分时点数据缺失,预测模型实在难以建立,更遑论让模型具有自学习、自适应的能力。...