培訓目標:
HADOOP ECOSYSTEM介紹與部署實際操作
分布式程序(MapReduce)開發實戰
Hive系統的部署與使用
基于列蔟的NoSQL—Hbase&Cassandra
培訓大綱
分布式系統介紹分布式存儲系統:HDFS
分布式計算系統:MapReduce
海量數據分析系統:Hive
分布式協調系統:Zookeeper
分布式實時讀寫數據存儲系統:HBase
工作流調度系統:Ooize
Hadoop系統部署實際操作 選擇合適的Hadoop版本
分布式部署Hadoop
系統校驗
分布式程序(MapReduce)開發實戰
MapReduce編程理論什么是MapReduce
MR程序開發準備
MR程序的調試
MapReudce編程實戰 CASE 1:基本MapReduce程序編寫
CASE 2:基于MapReduce的Sort操作
CASE 3:基于MapReduce的Join操作
CASE 3:Hadoop多語言編程框架Streaming
海里網站日志分析系統示例網站日志介紹
業務分析
系統實現
Hive系統的部署與使用
Hive系統部署搭建Hive客戶端
搭建Hive元數據庫(MySQL)
Hive系統使用 Hive工作原理
Hive DDL
Hive DML
Hive Query
基于列蔟的NoSQL—Hbase&Cassandra
HBase系統理論系統 |