大数据平台并不生产数据,大多数原始数据其实都来源于业务系统,所以,我们需要做好数据“搬运”动作。而这就牵扯到了“数据集成”这个概念。这篇文章里,作者就谈了谈他的见解和感受,一起来看看吧。
我不生产数据,我只是数据的搬运工。
在大数据平台中,是不生产数据的,或者说原始数据都是来源于业务系统。所以,我们需要做的第一件事,就是将业务系统的数据搬运到数据平台。
改用那句耳熟能详的话,我不生产数据,我只是数据的搬运工。这个数据的搬运工,就是数据平台的第一个模块——数据集成。
一、搬运工都有哪些称呼
在进行产品设计的过程中,对于同一个产品,经常会遇到各种各样的名称,这些名称好像可以指代同一个产品,如果细究起来,好像也有些区别。
在数据集成产品设计时,也会遇到类似的问题。这些相同的名称主要是数据集成、数据同步、数据采集。有时候也可能听到数据管道、数据传输等等。
我通过大模型搜索了一下区别。
评论留言