会议详情 菜单
2019大数据平台数据湖和数据治理(10月广州班)

2019大数据平台数据湖和数据治理(10月广州班)

2019-10-19 08:00 至 2019-10-20 18:00

广州  

麦思博(北京)软件技术有限公司(msup)   

报名截止

推荐会议:SECON 2024全球软件工程技术大会·上海

发票类型:增值税普通发票 增值税专用发票

-会议内容-

课程简介

大数据平台数据湖和数据治理

-主办方介绍-

 麦思博(北京)软件技术有限公司(msup) 麦思博(北京)软件技术有限公司(msup)

麦思博(msup)有限公司发源美国西雅图,2007年创办,是一家面向技术型组织的培训咨询机构,服务于技术团队的技能提升、软件工程的实际应用和产品品质的创新与超越。强调人员、技术、流程和管理的有机结合,注重角色岗位的技能提升与职业发展,以及技术团队复合管理与协作。每年超过1000家企业续单参与msup旗下公开课、工作坊、案例研究、国际游学等培训项目。

课程大纲

数据治理范围 大数据平台数据建设中存在的问题
数据治理面临的挑战
数据的多元化
数据的复杂性
数据的完整性
数据生命周期管理
统一元数据管理
数据集成方法
数据安全
数据湖架构
基于大数据平台的数据建模
RMDBS数据的增量实时同步采集
数据质量管理 数据质量管理的范围
数据质量评估的维度
数据质量的维护管理
数据质量的改进管理
数据质量管理模型
数据质量管理的监控
案例演示
元数据管理 元数据概念
Hadoop平台元数据处理面临的问题
元数据注册机制
元数据的统一管理
元数据一致性管理
数据字典的概念
元数据的添加和需改管理
基于Hadoop平台元数据处理方案
数据生命周期管理 数据质量
数据标准
数据生命周期管理的重要性
数据生命周期的概念
开源Falcon解决那些问题
Falcon架构和原理
Falcon实战
Falcon+HDFS、Hive实战
Falcon+Oozie实战
数据湖 数据湖定义
数据湖里面数据存储格式
数据湖实现的步骤 
HDFS、Hive等实现数据湖
数据湖分区(LCRD)
LCRD详解
某大型银行基于Hadoop的数据湖实战解析
测试数据环境的搭建 测试数据的准备
测试数据的脱敏机制
数据脱敏的方法
数据关联的脱敏机制 
测试环境搭建的要求
测试环境性能的评估原则
数据仓库的敏捷开发 敏捷开发的含义
敏捷数据仓库的定义
为什么需要敏捷数据仓库
敏捷数据仓库和传统数据仓库的区别
敏捷数据仓库实现的模型
在Hadoop上面实现敏捷数据仓库的思路
案例分析 Hadoop之上数据仓库案例解析
数据湖案例解析和演示

Gavin.Liu

Teradata 云平台系统架构师

目前在Teradata担任GCA大数据架构师,曾经在阿里巴巴和高德,任职于大数据平台建设(Hadoop)。

1)编写并出版《Hadoop应用开发技术详解》图书,销售10000+册——机械工业出版社(2014-01)

2)专利《海量数据基于记录级别的容错》

-会议门票-

会务费:6800元/人,含参会费,住宿交通自理。

会议标签:

大数据 大数据平台 数据治理

温馨提示
酒店与住宿: 异地参会客户请注意,为防止会议临时变动,建议您先与活动家客服确认参会信息,再安排出行与住宿事宜。
退款规则: 活动各项资源需提前采购,购票后不支持退款,可以换人参加。

相关会议

分享到

QQ好友 QQ空间 微博 ×