• 欢迎访问热点图书网

穿越数据的迷宫:数据管理执行指南-电子书下载

人文社科 2年前 (2022-07-13) 1350次浏览 已收录 0个评论 扫描二维码

简介

本书分12章重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。

作者介绍

劳拉•塞巴斯蒂安-科尔曼是国际数据管理协会(DAMA)资深会员,从事数据管理,特别是数据质量管理20多年,在美国数据管理行业享有很高的声誉,是许多重量级数据管理会议的演讲嘉宾。她先后在多家金融保险公司担任数据主管,包括Cigna、United、Aetna等。

部分摘录:
数据整合与互操作
数据存储和操作活动侧重于存储和维护数据的环境,但数据整合与互操作(Data Integration and Interoperability,DII)活动包括在数据存储和应用程序内部及其之间迁移与整合数据的过程。数据整合是将数据整合为一致的形式,无论是物理形式,还是虚拟形式。数据互操作是多个系统进行沟通的能力。要整合的数据通常来自组织中的不同系统。组织也越来越多地将外部数据与自身生成的数据整合在一起。
DII解决方案支持大多数组织所依赖的基本数据管理功能:
(1)数据迁移和转换。
(2)数据整合到数据总线或数据集市中。
(3)将供应商软件包整合到组织的应用程序组合中。
(4)应用程序之间和跨组织之间的数据共享。
(5)跨数据存储和数据中心分发数据。
(6)数据存档。
(7)管理数据接口。
(8)获取和摄取外部数据。
(9)整合结构化和非结构化数据。
(10)提供业务情报和管理决策支持。
数据整合与互操作实践和解决方案的实施旨在:
(1)以数据消费者(包括人员和系统)所需的格式和时间表提供数据。
(2)将数据物理地和虚拟地整合到数据集线器中。
(3)通过开发共享模型和接口,降低管理解决方案的成本和复杂性。
(4)识别有意义的事件(机会和威胁),并自动触发警报和采取应对措施。
(5)支持商务智能、数据分析、主数据管理和运转效率工作。
DII解决方案的设计需要考虑:
(1)更改数据采集:如何确保数据正确更新。
(2)响应时延:从创建或采集数据到使用数据的时间间隔。
(3)复制:如何分发数据,以确保其性能。
(4)编排:如何计划和执行不同的流程,以保持数据的一致性和连续性。
DII的核心价值是确保数据在组织内部和组织之间,能够在不同的数据存储中高效地迁移。设计时要注意降低复杂性,这一点非常重要。大多数企业都有数百个甚至数千个数据库。如果DII没有得到有效的管理,仅仅管理接口就可能让IT组织不堪重负。
由于其复杂性,DII依赖于其他数据管理领域,包括以下几个方面:
(1)数据治理:用于治理转换规则和消息结构。
(2)数据架构:用于设计解决方案。
(3)数据安全性:用于确保解决方案能有相应的方法来保护数据的安全性。这适用于在应用程序与组织之间移动的数据(持久的、虚拟的和动态的)。
(4)元数据:用于跟踪数据(持久的、虚拟的和动态的)的技术清单、数据的业务含义、转换数据的业务规则及数据的操作历史和谱系关系。
(5)数据存储和操作:用于管理解决方案的物理实例化。
(6)数据建模和设计:用于设计数据结构,包括数据库中的物理持久性、虚拟数据结构及在应用程序和组织之间传递信息的消息。
数据整合与互操作对于数据仓库和商务智能、参考数据与主数据管理至关重要。因为所有这些来自于多个源系统的数据都被转换与整合到集线器中,并从集线器传输到目标系统,在那里被传递给数据消费者(系统和人)。
数据整合与互操作也是大数据管理新兴领域的核心。大数据旨在整合各种类型的数据,包括数据库中结构化和存储的数据、文档或文件中的非结构化文本数据、其他类型的非结构化数据,如音频、视频和流媒体数据。可以通过挖掘这种整合的数据,将其用于开发预测模型,并部署到运营智能活动中。
实施DII时,组织应遵循以下原则:
(1)在设计中考虑企业视角,确保未来的可扩展性。当然,这是通过迭代和渐进交付来实现的。
(2)平衡本地数据需求与企业数据需求,包括数据的启用和维护。
(3)确保DII设计和活动的业务问责制。业务专家应参与数据转换规则的设计和修改,这包括各种持久性的规则及虚拟性的规则。

下载地址

下载
喜欢 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址