如果想要做数据,一定免不了遇到提取数据的需求。提取数据要经历的步骤可分为接收需求、确认需求、数据提取、数据检查、数据提交这五个步骤。

一般来说,数据人的工作肯定是多个数据需求同时进行的,那么当我们手里有多个需求时,我们一定要懂得把握数据提取的节奏。以上提到的数据提取步骤都要预留一定的时间。需求方给你个需求,要求三天后完成,你总不能第三天才打开工单看对方提的是什么需求吧。

所以接收到数据需求,建议首先花个碎片时间,先接收需求,先看懂对方想要的数据是怎么样的。大概心里有个底,提取对方想要的数据需要花多长时间,是必须早点动手还是可以晚点动手。

第二步是确认需求,如果接收工单时你的需求方已经给你说的明明白白要什么数据,那么恭喜你,你遇到的需求方在某种程度上其实挺懂数据的。但是大部分时候,由于提需求的是其他工作内容的同事,他们提需求可能天马行空、表头矛盾、无侧重点、关注a的东西却提了b的表头、甚至表头写错等一系列状况,所以作为数据人,以上情况都需要跟对方确认清楚。我知道有些做数据的小伙伴是表头写什么就给什么,但是这会加大返工的可能。

第三步是数据提取,数据提取最常见的是写SQL和将SQL放到跑数平台跑,基于SQL复杂程度和跑数平台特点要对这一步骤时间做个预估,如果跑数时间比较长,可以先跟需求方说一声,让对方心里有个底。
第四步是数据检查,这一点是很重要的。主要是基于自己的数据敏感度和一些数据逻辑关系对数据结果做个检查。

最后一步是数据提交,在数据在处理的过程中若发现数据需求的日期范围内有业务非常规情况发生和对数据进行了特殊的处理,应备注说明。同时可将数据输出格式做的好看一些。

完成数据提取的过程也是我们筛斗数据给数据需求方建立信任感的过程,所以这些步骤都不能错过哦。

 


点赞(2) 打赏

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部