<thead id="fflbj"><font id="fflbj"><cite id="fflbj"></cite></font></thead>
    <progress id="fflbj"><thead id="fflbj"><font id="fflbj"></font></thead></progress>

            曙海教育集團
            全國報名免費熱線:4008699035 微信:shuhaipeixun
            或15921673576(微信同號) QQ:1299983702
            首頁 課程表 在線聊 報名 講師 品牌 QQ聊 活動 就業
             
            大數據 Hadoop基礎與電商行為日志分析課程培訓

             
              班級規模及環境--熱線:4008699035 手機:15921673576( 微信同號)
                  每個班級的人數限3到5人,互動授課, 保障效果,小班授課。
              上間和地點
            上部份地點:【上?!客瑵髮W(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈
            最近開間(周末班/連續班/晚班):2019年1月26日
              實驗設備
                ◆小班教學,教學效果好
                   
                   ☆注重質量☆邊講邊練

                   ☆合格學員免費推薦工作
                   ★實驗設備請點擊這兒查看★
              質量保障

                   1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
                   2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
                   3、培訓合格學員可享受免費推薦就業機會。☆合格學員免費頒發相關工程師等資格證書,提升職業資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。

            部份程大綱
             
            • 第1章 大數據概述
              本章將從故事說起,讓大家明白大數據是與我們的生活息息相關的,并不是遙不可及的,還會介紹大數據的特性,以及大數據對我們帶來的技術變革,大數據處理過程中涉及到的技術以及大數據典型應用。
            • 1-1 課程導學 試看
              1-2 學前必讀(助你平穩踩坑,暢學無憂)
              1-3 課程目錄
              1-4 從一個案例說起
              1-5 什么是大數據以及大數據的4V特征 試看
              1-6 大數據帶來的技術變革
              1-7 大數據現存的模式
              1-8 大數據的技術概念
              1-9 大數據帶來的挑戰
              1-10 如何對大數據進行存儲和分析
              1-11 大數據典型應用
              第2章 初識Hadoop
              本章節將帶領大家認識Hadoop以及Hadoop生態系統、Hadoop的發展史、Hadoop的優勢、Hadoop的三個核心組件、Hadoop發行版的選擇,為后續深入講解Hadoop打下堅實的基礎。
            • 2-1 課程目錄
              2-2 Hadoop概述
              2-3 Hadoop核心組件之HDFS概述
              2-4 Hadoop核心組件之MapReduce
              2-5 Hadoop核心組件之YARN
              2-6 Hadoop優勢
              2-7 Hadoop發展史
              2-8 Hadoop生態圈
              2-9 Hadoop發行版選型
              2-10 OOTB環境的使用
              第3章 分布式文件系統HDFS
              本章將從Hadoop的設計目標、架構及文件系統命令空間出發,快速搭建單節點偽分布式HDFS的實驗環境,通過講解使用hdfs shell以及Java API的方式操作HDFS文件系統,詳細分析HDFS文件的讀寫流程,并通過HDFS API來實現詞頻統計案例,使得大家對Hadoop分布式文件系統HDFS有深刻的認識以及實戰。 ...
            • 3-1 HDFS概述
              3-2 HDFS設計目標
              3-3 HDFS架構詳解
              3-4 文件系統NameSpace詳解
              3-5 HDFS副本機制
              3-6 本課程使用的Linux環境介紹
              3-7 Hadoop部署前置介紹
              3-8 JDK1.8部署詳解
              3-9 ssh無密碼登陸部署詳解
              3-10 Hadoop安裝目錄詳解及hadoop-env配置
              3-11 HDFS格式化以及啟動詳解
              3-12 HDFS常見文件之防火墻干擾
              3-13 Hadoop停止集群以及如何單個進程啟動
              3-14 Hadoop命令行操作詳解
              3-15 深度剖析Hadoop文件的存儲機制
              3-16 HDFS API編程之開發環境搭建
              3-17 HDFS API編程之第一個應用程序的開發
              3-18 HDFS API編程之jUnit封裝
              3-19 HDFS API編程之查看HDFS文件內容
              3-20 HDFS API編程之創建文件并寫入內容
              3-21 HDFS API編程之副本系數深度剖析
              3-22 HDFS API編程之重命名
              3-23 HDFS API編程之copyFromLocalFile
              3-24 HDFS API編程之帶進度的上傳大文件
              3-25 HDFS API編程之下載文件
              3-26 HDFS API編程之列出文件夾下的所有內容
              3-27 HDFS API編程之遞歸列出文件夾下的所有文件
              3-28 HDFS API編程之查看文件塊信息
              3-29 HDFS API編程之刪除文件
              3-30 HDFS項目實戰之需求分析
              3-31 HDFS項目實戰之代碼框架編寫
              3-32 HDFS項目實戰之自定義上下文
              3-33 HDFS項目實戰之自定義處理類實現
              3-34 HDFS項目實戰之功能實現
              3-35 HDFS項目實戰之使用自定義配置文件重構代碼
              3-36 HDFS項目實戰之使用反射創建自定義Mapper對象
              3-37 HDFS項目實戰之可插拔的業務邏輯處理
              3-38 HDFS Replica Placement Policy
              3-39 HDFS寫數據流程圖解
              3-40 HDFS讀數據流程圖解
              3-41 HDFS Checkpoint詳解
              3-42 HDFS SaveMode
              第4章 分布式計算框架MapReduce
              本章將從架構、編程模型等角度帶大家認識Hadoop的分布式計算框架MapReduce,掌握MapReduce各個核心組件編程,并通過兩個案例讓大家深入掌握MapReduce編程的方方面面。
            • 4-1 課程目錄
              4-2 MapReduce概述
              4-3 MapReduce編程模型詳解
              4-4 MapReduce編程模型核心概念詳解
              4-5 詞頻統計之自定義Mapper實現
              4-6 詞頻統計之自定義Reducer實現
              4-7 詞頻統計之自定義Driver類實現
              4-8 詞頻統計之本地方式運行
              4-9 詞頻統計之通過Debug方式進一步了解偏移量以及重構代碼
              4-10 詞頻統計升級之Combiner操作 試看
              4-11 流量統計實戰之需求
              4-12 流量統計實戰之自定義復雜數據類型
              4-13 流量統計實戰之自定義Mapper類
              4-14 流量統計實戰之自定義Reducer實現
              4-15 流量統計實戰之Driver開發
              4-16 流量統計實戰之代碼重構及NullWritable的使用
              4-17 流量統計實戰升級之自定義Partitioner
              第5章 資源調度框架YARN
              本章將從YARN的產生背景、YARN的架構及執行流程的角度帶大家認知Hadoop的資源調度框架YARN,快速搭建單節點偽分布式YARN的實驗環境并掌握如何提交MapReduce作業提交到YARN上運行。
            • 5-1 課程目錄
              5-2 YARN產生背景
              5-3 YARN概述
              5-4 YARN架構詳解
              5-5 YARN執行流程
              5-6 YARN環境部署
              5-7 提交example案例到YARN上運行
              5-8 提交流量統計案例到YARN上運行
              第6章 電商項目實戰Hadoop實現
              本章將通過電商用戶行為日志分析的項目實戰,來將前面幾個章節講解的知識點串聯起來,綜合使用Hadoop的技術進行離線統計分析。
            • 6-1 課程目錄
              6-2 用戶行為日志概述
              6-3 為什么要記錄用戶行為日志
              6-4 日志內容介紹
              6-5 用戶行為日志分析的意義所在
              6-6 電商常用術語
              6-7 項目需求描述
              6-8 數據處理流程及技術架構
              6-9 瀏覽量統計功能實現
              6-10 省份瀏覽量統計之IP庫解析
              6-11 省份瀏覽量統計之日志解析
              6-12 省份瀏覽量統計之功能實現
              6-13 頁面瀏覽量統計之頁面編號獲取
              6-14 頁面瀏覽量統計之功能實現
              6-15 數據處理過程中ETL的重要性
              6-16 原始日志ETL操作
              6-17 瀏覽量統計功能升級
              6-18 省份瀏覽量統計功能升級
              6-19 頁面瀏覽量統計功能升級思路
              6-20 打包到服務器上運行
              6-21 項目擴展
              第7章 數據倉庫Hive
              本章將從Hive的產生背景、體系架構、Hive部署、DDL以及DML來掌握Hive使用的方方面面。
            • 7-1 課程目錄
              7-2 Hive產生背景
              7-3 Hive是什么
              7-4 為什么要使用Hive
              7-5 Hive在Hadoop生態圈中的位置
              7-6 Hive體系架構
              7-7 Hive部署架構
              7-8 Hive與RDBMS的區別
              7-9 Hive部署
              7-10 Hive快速入門
              7-11 Hive DDL之數據庫操作
              7-12 Hive DDL之表操作
              7-13 Hive DML之加載和導出數據
              7-14 Hive QL基本統計
              7-15 Hive QL之聚合函數
              7-16 Hive QL之分組函數
              7-17 Hive QL之join的使用
              7-18 Hive QL執行計劃
              第8章 電商項目實戰Hive實現
              本章將使用Hive對電商用戶行為日志分析進行重新實現,讓大家對MapReduce編程和Hive實現的方式進行對比,體會Hive在生產上使用的便捷性。
            • 8-1 課程目錄
              8-2 外部表在Hive中的使用
              8-3 track_info分區表的創建
              8-4 將ETL的數據加載到Hive表
              8-5 使用Hive完成統計分析功能
              8-6 Hive實現項目的方便性體現
              第9章 Hadoop分布式集群搭建
              本章將帶領大家搭建一個三個節點的分布式Hadoop集群環境,讓大家對于Hadoop集群的安裝有更深入的認識,并將項目實戰案例運行在分布式集群環境中。
             

            -

             

              備案號:備案號:滬ICP備08026168號-1 .(2024年07月24日)...............
            538在线视频二三区视视频