大数据最近几年变成了非常火的名词,我感觉大数据这个词有些被媒体泛化了,侠义的大数据概念应该来自互联网行业,是谷歌首创了大数据技术,国内互联网行业也随后跟进,我这里讲的大数据技术就是这种侠义的大数据。因为互联网行业针对的是C端客户,数据相对容易实现爆发式增长,所以大数据技术解决了互联网行业的痛点,而这种大数据技术是不适合于传统的零售行业和工厂生产ERP系统的,这些领域传统的关系型数据库更加适合,所以新零售的主角应该还是传统关系型数据库而不是大数据技术。传统行业中,电信和金融行业数据量还是很大的,我这里的传统行业主要主要指零售行业和工厂生产企业,是供应链信息化领域,在传统行业当中应该是一个非常大的比例。
传统行业数据量不是非常大,关系数据库可以处理
应用大数据技术的互联网企业都是平台企业,如果BAT,谷歌,脸谱,亚马逊等,面向C端客户的平台企业必然会有大量的数据。而零售连锁企业和工厂生产企业一般不是平台类型的,是企业自有的经营数据,数据增长一般不会很快。
一个门店数量为5000的企业,如果实现全部门店零售原始数据都在总部汇总,那么总部的销售数据表也应该是千万行级别的,传统数据库通过系统调优是可以处理这个级别的数据的,如果需要保存多年的数据,也完全可以通过数据库分库分表来实现。
现在市面流行的SAAS软件公司走的是平台化路线,但规模还远没有上来,而且入住企业都是小型企业,数据量也不会增加很快。即使SAAS企业规模上来,存放数据的模式也是和互联网企业不同的,互联网企业是C端客户数据,可以把数据都混放在一起,比如淘宝消费者的收藏信息,而SAAS企业需要把不同企业经营数据分开存放才合理,这样方便企业自身进行数据分析,每个企业都有自己独立私密的数据空间,例如给不同企业建立不同的关系数据库实例,关系数据库在数据分析上面更成熟。当然也有例外,钉钉这种非结构化数据居多的SAAS应用,使用大数据存储方式会比较合理。
传统企业数据分析,结构化数据居多,适合关系数据库
传统行业分销进销存数据,工厂ERP数据和相关的财务数据都是结构化数据,之间有紧密的相关性,通过分组聚合即可实现数据分析。例如通过一定时期分类维度的销售占比来验证当前库存结构是否合理,这些都是基于零售数学即可完成的分析,比如计算售罄率和库销比等指标。大数据技术在互联网行业用于推荐系统,搜索排序系统等,需要建立大规模的稀疏矩阵,需要使用到人工智能的算法,这些算法并不适合传统领域的进销存类数据分析。
大数据技术使用成本高
大数据的使用成本是极高的,对运维工程师和开发工程师都有更高的要求,工资是一般工程师的2倍以上,其实大数据技术也只在互联网行业的头部企业才有很好的应用。而传统行业的IT人员能玩转传统数据库的都已经很少了,众多的中小企业连传统数据库都玩不转,很多中小企业的IT人员连基础的数据维度和度量指标都搞不懂。其实,传统行业真正解决好信息孤岛问题,解决好数据收集问题,学会传统数据库的数据分析技巧,就可以实现经营管理的巨大改变,根本不需要什么高大上的大数据技术。
传统数据库技术成熟,使用风险较低
大数据技术还在不断的发展和完善当中,头部互联网公司有足够的人力和财力来完善大数据技术,很多开源的大数据技术常常会遇到坑,而且需要到社区论坛寻找解决方案,甚至直接修改代码自己解决问题。传统数据库发展已经几十年了,如开源数据库Postgres和MySQL的商业化都已经非常成熟了,对技术力量一般的传统企业会减少很大麻烦。
总结
技术选择是一个需要综合考量的事情,不能看热闹跟潮流,大数据虽然是热点技术而且确实可以处理大量的数据,但这不能作为技术选择的主要依据。空客380失败了,它是人类历史上载人最多的飞机,但运营成本过高,而且上座率不足,导致商业角度是失败的。传统企业选择技术也是一样,自身业务需求,成本和人力情况都需要考虑进去,才能实现最终的成功的商业效益,适合才是最好的。如果追求单一的大数据处理能力,只能是和空客380一样的结局,商业运作上面是不能指望一口吃个大胖子的。




