真正的数字化,从「数据互联」开始

imgRainful2019-12-19

一家公司从成立到IPO大概需要多久?

5月17日,中国新零售品牌瑞幸咖啡在纳斯达克正式挂牌交易,从创立到IPO,瑞幸咖啡只花了17个月时间,刷新了趣头条2年零3个月的记录,创造了全球最快IPO公司的纪录。

瑞幸咖啡作为新零售行业的一个缩影,直观地传递出一个信号:这是一个唯快不破的时代。

伴随着业务的快速变化,零售行业对技术痛点的感受较其它行业更为深刻,变化的意愿也更加强烈。其中,在数据使用上面临“多”与“快”的问题:

一、「多」,表现在

1. 数据种类来源多

目前零售业线下店分布较广,信息散落在各处,如POS、CRM、ERP、OA以及供应链等系统中。且种类多样,未能实现有效整合,数据价值分散,如何打通数据孤岛获取数据成为零售企业亟需解决的问题。

2. 数据量多

在之前的数据仓储时代,如果能做到100个TB就可称为业界第一。而当下,许多零售行业已经开始在PB级的大数据舞台上做各种数据分析。

3. 零售行业人少事多

现阶段业务处理对于人力的依赖过大,但有些零售连锁企业IT部门的数据组只有个位数的工程师,数据处理工作负荷高,处理效率已经成为业务扩展的瓶颈。

二、「快」,表现在

1. 数据采集非常快

采集是快速处理数据的第一步,零售行业的数据采集需要非常快,通常按秒计算。这些数据可以帮助企业在业务关键决策上提供洞察,抓住机遇。

以某企业为例,为满足中国消费者叫外卖送餐的习惯和外卖平台宣布合作,从2018年9月开始首先在全国范围内150家门店提供配送服务。此时,第三方配送系统的库存数据需要与门店的库存实时保持同步,以避免超售的情况发生,及时响应订单需求势在必行。

另外,商场的专卖店也在采集数据上做了一系列努力,门店通过在衣服吊牌、货架上放置电子标签,准确地采集每件衣服的试穿率、触碰率等数据,通过采集这一系列数据,可以及时了解哪些为热销商品,以便及时补货。

2. 数据消费快,需要实时响应客户需求

优衣库创始人柳井正提到,真正意义上的客户满意是以超出顾客想象的形式,将顾客需要的商品提供给顾客。而优质体验的背后是技术和数据的支持。

比如,大家有时会在朋友圈看到有好友在购买某商品后发现有问题,打电话给客服之后,发现客服响应不及时,导致购买体验不佳。此时对用户而言,企业的及时响应显得尤为重要。

3. 数据时效性非常短暂

传统的财务数据,报表通常按天来计算,但现在零售行业数据的时效性可能是按小时,按分钟来计算的。

4. 数据项目要求见效快

零售行业的客户非常看重数据是否能指导销量,大家对于数据项目的要求非常高。而数据指导销量这短短六个字的背后意味着庞大的数据工作量。如何能在短期之内见效,非常考验我们对数据应用的能力。

面对上述种种情景,企业需要做哪些尝试和改变?

三、实现互联

首先是万物互联,任何一个用户的行为不仅仅是线上,还有线下,另外还有各种第三方数据要求企业实现万物互联。

其中,对于数据而言,也应实现互联。数据只有流通、共享、跨界后才能实现价值的飞跃。

另外是智链企业。在毕马威中国和中国连锁经营协会联合发布的《重塑增长—2019中国零售数字化力量》报告中首次出现了针对零售行业数字化转型的核心框架和能力模型——“智链企业”。

报告发现中国内地大量实体零售企业在敏捷供应链、数据和分析、数字化技术架构、生态合作伙伴协同等方面存在较大的提升空间。

就协同而言。DataPipeline在服务客户中发现,一家数据驱动良好的企业,其显著特点是协同做的非常好,即每当做数据分析时可以调动更多的业务部门和数据、工程团队共同完成一件事情,这是智链企业的一个显著特征。

尽管报告指出我们在很多业务领域上的发展已经处于领先位置,但数据和分析能力仍旧是所有能力象限中最弱的两个环节。我们希望能够一招制胜,但恰恰忽略了基础数据的建设。有时企业在做一些项目时,往往花在数据准备环节上的时间和人力是最大的。

在日前O'Reilly 公司举办的一场为期数天的数据会议中,数据科学家指出内部数据平台正成为企业增长和创新的关键。尽管一些项目,诸如机器学习和人工智能并不总是需要实时数据,但构建能够处理数据系统的能力也是一种竞争优势。

过去在服务一些客户时,我们发现数据分析师有80%的时间在做非常精准的数据工作,而这也是我们目前需要帮助大家解决,加快的重要环节。

四、从「大数据」到「快数据」

自2012年大数据概念开始深入人心后,有一阶段如果不懂大数据都不好意思见人。再反观当下,大家已经开始从之前的Big Data转而关注Fast Data。

Fast Data即快数据。快不仅意味着数据采集快,也要求具备快速消费的能力。

快速消费能力体现在实时的经营数据分析、用户行为和用户互动,配货等一些非常典型和要求对数据消费非常快的情况。

之前我们更多关注的是大数据中的历史数据,如客户行为数据、历史账单等,却很少关注实时数据。目前许多客户都拥有自己的快数据,且已经从过去数据仓库时代的T+1转为现在按小时、分钟甚至秒追踪运营效率。

五、数据的供应链

其实数据同货物一样,是在内部流转的供应链,所以企业要将数据像供应链一样进行管理。就数据管理而言,有三个重要特点:

第一,面向共享

过去做数据项目最大的困难是数据难以被共享,我们在跟客户打交道的过程中发现,客户若想从ERP中抽数据非常困难。面向共享有助于促进内部数据资源的整合,实时掌握业务的全面运行情况。

第二,面向流通

过去传统做数据的误区是我们希望将所谓的企业内部所有资产都盘点清楚。然而在我参与过这么多的客户项目中基本上没有一次能够把客户所有资产都整理清楚。

各个业务部门出于各自的顾虑,交出来的永远是我们可以看到的数据中的少部分。如果一个部门中的数据跟另外一个部门的数据不会发生碰撞,不进行流通,几乎很难产生价值。

为此,让数据实时流转于各个数据孤岛,提高数据流通性,是企业最大化挖掘数据价值的必经之路。

第三,面向管理

无论是自建系统,还是使用第三方系统,最核心的一点是能将里面的数据管理起来。

下图为DataPipeline真实的客户IT流量,该客户拥有将近200个业务系统,后台有各种数据链路。这时数据可知、可见、可用、可管、可信,可追溯将会是一个巨大的难题。

只有在公司工作十年以上,跟各个系统的建设打过交道的人才可能了解所有系统之间的数据。可想而知,对于我们后续想要用数据做项目来讲到底有多困难?

DataPipeline认为数据也是需要运营的。因为数据在流转过程中,如果任何一个环节发生故障都会导致数据不可用,可能造成业务中断。

这是我们数据人一直不断持续追求的目标,希望数据能够像管道一样在企业内部充分得到流通,让每一个想用数据的人都能够充分地使用数据。

六、从「数据治理」到「数据协同」

数据治理是一个长效且基础的工程,虽然耗时费力但又是一个必要的工程。

为此,我们更多地提倡数据协同,数据协同与数据治理最大的区别在于:前者小而美,后者大而全。

小而美指企业要想办法做到部门团队间充分地协同,这样才能用技术,流程,工具,文化,赋能业务部门,而不仅仅是交付结果。

这不是大鱼吃小鱼的时代,这是一个唯快不破的时代。

随着企业应用系统的增多,消灭数据孤岛的速度已经赶不上企业创建新的孤岛的速度。企业不得不快速迭代,快速创新,快速试错才能跟上这个时代,及时响应客户需求。

为能更好地解决上述问题,赋能客户,DataPipeline坚持践行DataOps的理念。

该理念与过去最大的区别在于,强调团队之间的协同,以及数据和系统之间的整合。

在以前数据需求方想要获取数据需要跨多个部门,这些部门之间每个人都在按自己的理解去理解需求方想要什么,中间沟通的链路越长,信息的损失也越大。

相较于直接获取数据结果,DataPipeline发现越来越多的业务部门更倾向于技术部门能向其开放基础数据平台的相关权限。如果业务数据足够丰富,便能直接登录平台找到想要的数据。

而在过去,业务部门在没有权限的情况下,只能通过跨部门完成数据获取工作,效率和沟通成本较高。

DataOps从理念到实践,具体表现为:

1. 术业有专攻,专业的团队负责专业的内容,可统一管理数据流向;

2. 可自动化部署数据流任务,实现快速配置与开发;

3. 得以全盘掌控数据流向,监控数据流的各种潜在故障,保障了数据可见、可用、可控。

通过推动流程的改进,组织架构的调整,和技术的创新,使得与数据打交道的每一个人:开发、数据工程师、数据科学家、业务分析师和业务用户得以密切合作。紧密地连接了数据供应链上的每一个环节,从数据采集、准备,到数据分析,直至最终将分析结果运用产生业务成效。

这是一个快以制胜的时代,数字化的影响力正在以指数级的增长态势呈现在零售企业面前。无论是数字化、娱乐化还是平台化、全渠道化,在这四要素的背后无一例外都离不开数据这一基本要素。

如果想与消费者建立更直接、更深入的连接,不如先从简化数据准备工作开始... ...

参考资料:毕马威中国 .《重塑增长—2019中国零售数字化力量》. 2019-04 .


用数据驱动决策与创新!