要调到一个新的商业公司数据团队,需要从零开始搭建数据中心,往往让人无从下手。本文作者根据自己转岗的经历,按照实践中的逻辑思维给出了详细的例子,帮助数据分析师新手进一步学习数据库的应用,推荐有困惑的数据分析师阅读学习~
数据中心整体的思路是基于现有的业务系统,接入数据后,将模型部署在前端,用于支持业务分析场景。
这个机会也是给刚接触SQL的朋友一个更贴近业务现实的实际案例。
我常说,数据分析师的价值在于解决业务问题。那么这个数据中心项目解决的是什么样的问题,又是如何解决的呢?我们按照“始于终”的思维逻辑来梳理一下吧。
00-1010,业务需求已经明确,接下来要建立能够支撑业务发展的数据中心。
根据数据处理流程,数据中心可分为落地层、建模层和数据层。
00-1010建模层和数据层对业务部门来说是不易察觉的。建模层是支撑价值落地的数据模型,如在线BI系统中的报表,由于其背后复杂的表间关系,需要业务逻辑和表格模型支撑;数据分析报告背后的洞察分析需要像帕累托分析、关联算法等数据模型支撑。.一样
00-1010这一层次,我们需要关注最小颗粒度的数据,即数据库层面的表格与字段,这一造型层的具体操作要素。通俗地说,业务数据需要从不同的数据源访问,并且同步更新。
数据清洗等过程确保数据的完整性及准确性。了解完数据赋能的三个层次,回过头来看看如何把业务需求转为数据问题。
(1)落地层
业务部门都有KPI指标,在运营工作中,需要定期回顾运营成效及执行下一阶段的运营策略。对业务来说,运营策略的落地需要借助触达工具:发短信。因此,「RFM模型」的落地不能只是给出算法模型报告,而是要以报表的形式,对存量用户进行分群的同时,搭配策略分析工具,并提供用户信息下载
根据业务场景,确定可以通过PowerBI在线报表的形式,为用户运营部门提供在线人群分层报表,并交叉零售行业常用的「人货场模型」及「指标拆解」作为策略分析工具。
(2)建模层
明确了落地的形式后,需要对背后的「RFM模型」和「人货场模型」及「指标拆解」进行数据层面的定义。
(3)数据层
明确了需要开发的数据模型,需要对更细颗粒度的数据库表格及字段进行设计。
(1)落地层
对于企业来说,产品策略背后的影响因素多且复杂,比如市场培育、公司战略等。也就是说,对于数据部门来说,做的新品分析或许更多只是辅助工作,供产品部门参考新品表现。此外,与产品部门沟通业务流程时,他们还提及日常还会用数据部门提供的表格做二次分析。
根据此业务场景,确定可以通过Metabase平台的形式做在线报表,业务部门能在平台上下载数据的同时,也可以在线做透视分析。
此场景其实为了介绍Metabase平台设计的,该工具在解决业务们自助取数,及简单BI报表方面很实用。可以先通过官网了解:www.metabase.com。后面会有具体的教程出来。
(2)建模层
明确了以报表形式提供新品分析后,需要考虑新品分析背后的表格模型,可以结合「存销分析」来实现,即分析新品的销售与库存之前的相关指标,体现新品表现。
(3)数据层
销售及库存相关的指标分析,需要用到订单表、库存表,除了用户运营提及的订单字段外,还需要货品批次号、数量等库存字段。
至此,我们完成了从业务需求出发,到落地层、建模层及数据层的倒推,形成了数据赋能业务的整体框架:
(后续会丰富此框架)
接下来,需要逆着第二步的思考逻辑,形成执行计划。
接下来会按照上述计划,逐步实现数据中心的落地。
本文由 @饼干哥哥 原创发布于人人都是产品经理。未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。