管理仓库数据的14.5.实施准则——管理大数据

大数据
后台-插件-广告管理-内容页头部广告(手机)

14.5.实施准则。管理仓库数据的许多一般性原则适用于管理大数据,以确保数据源可靠、具有足够的元数据以启用数据使用、管理数据质量、了解如何集成来自不同源的数据并确保数据安全。请参阅第6-7、8章。实现大数据环境时,存在许多未知因素。

如何使用数据?哪些数据有价值需要保留多长时间?数据速度可能使人认为他们没有时间实施控制,这是一个危险的假设。对于更大的数据集,在数据湖中管理摄取和盘点数据对于防止数据湖成为数据沼泽至关重要。摄取数据到组织的数据湖、数据存储或数据暂存区域之前请执行此操作,一旦着陆再将其移走会很尴尬。14.5.1.战略一致性。任何大数据和数据科学计划都应与组织目标保持一致性,并建立大数据战略以推动与用户团体的合作。

管理仓库数据的14.5.实施准则——管理大数据

数据安全元数据管理(包括数据谱系)和数据质量管理相关的活动,该战略应记录目标方法和治理原则。利用大数据的能力需要建立组织技能和能力,使用功能管理来调整业务和IT计划并制定路线图。战略可交付成果应说明以下方面:

管理仓库数据的14.5.实施准则——管理大数据

·1.信息生命周期;

·2.元数据;

·3.数据质量;

·4.数据采集;

·5.数据访问与安全;

·6.数据治理;

·7.数据隐私;

·8.学习与采用;

管理仓库数据的14.5.实施准则——管理大数据

·9.业务操作(运营);

·14.5.2.现状评估和风险评估。

实施大数据或数据科学计划时,应符合实际的业务需求,评估与关键成功因素相关的组织准备情况:

·1.业务相关性:大数据和数据科学计划及其相应的用例与公司业务的融合程度如何?为了获得成功,他们必须大力执行业务功能或流程。

·2.业务准备情况:业务合作伙伴是否准备好长期增量交付?他们是否已承诺建立卓越中心来在将来的版本中维持产品?目标团体内的平均知识或技能差距有多大,且可以在单个增量内弥补吗?

·3.经济可行性:提议的解决方案是否保守地考虑了有形和无形的收益?所有权成本评估是否考虑了购买或租赁物品而不是从头开始建造的选项?

管理仓库数据的14.5.实施准则——管理大数据

·4.原型:能否在有限的时间范围内为最终用户团体的子集提供原型建议的解决方案,以证明建议的价值?大爆炸的实施可能会对美元造成重大影响,而试验场可以减轻这些交付风险。最具挑战性的决定可能会围绕数据采购平台开发和资源配置。1.数字数据存储存在许多资源,并非所有资源都需要内部拥有和操作,有些可以采购,有些可以租赁。

2.市场上有多种工具和技术,满足通用需求将是一个挑战。

3.及时确保具有特定技能的员工并在实施过程中留住顶尖人才可能需要考虑其他选择,包括专业服务云采购或协作。

管理仓库数据的14.5.实施准则——管理大数据

4.构建内部人才的时间可能远远超过交付时间。

→14.5.3.组织与文化变更。

为了充分利用高级分析的优势,业务人员必须充分参与,需要进行沟通和培训计划才能影响这一点,卓越中心可以提供培训启动集设计最佳实践,数据源技巧和窍门以及其他关键解决方案或工件,以帮助使业务用户拥有自助服务模型的能力。

除了知识管理之外,该中心还可以在开发人员、设计人员、分析师和数据消费者团体之间提供及时的沟通,与DW/BI一样,大数据实施将汇集许多关键的跨职能角色,包括:

1.大数据平台架构师:硬件操作系统文件系统和服务。

管理仓库数据的14.5.实施准则——管理大数据

2.数据摄取架构师:数据分析记录系统数据建模和数据映射,提供或支持将源映射到Hadoop集群以进行查询和分析。

3.元数据专家:元数据接口元数据架构和内容。

4.分析设计负责人:最终用户分析设计相关工具集中的最佳实践指导实施和最终用户结果集的简化。

管理仓库数据的14.5.实施准则——管理大数据

5.数据科学家:基于统计和可计算性的理论知识,提供适当的工具以及针对功能需求的技术应用,提供架构和模型设计咨询。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。