課程簡介
時下引領(lǐng)著技術(shù)變革的非“大數(shù)據(jù)”莫屬,本課程帶你全面掌握Hadoo和Spark開發(fā)的核心技能:HDFS 、MapReduce的搭建及框架的應用,了解最火爆最前沿的大數(shù)據(jù)技術(shù)發(fā)展趨勢。
目標收益
構(gòu)建大數(shù)據(jù)生態(tài)立體化的知識體系
掌握大數(shù)據(jù)核心應用技術(shù)
從大數(shù)據(jù)開發(fā)者成為具備大數(shù)據(jù)思維的技術(shù)專家
培訓對象
課程大綱
Hadoop生態(tài)系統(tǒng)概述(1H) |
1. 分布式文件系統(tǒng)HDFS 2. 分布式計算MapReduce 3. 分布式資源管理Yarn 4. 大數(shù)據(jù)SQL分析引擎Hive 5. 分布式機器學習與數(shù)據(jù)挖掘Mahout 6. NoSQL引擎HBase 7. 分布式一致性框架ZooKeeper 8. 高性能大數(shù)據(jù)引擎Spark |
HDFS原理與應用實踐(2H) |
1. HDFS高可用可伸縮架構(gòu)原理分析 2. HDFS配置與部署實踐 3. HDFS API編程實踐 |
MapReduce原理與應用實踐(2H) |
1. MapReduce編程模型與案例分析 2. MapReduce核心組件分析 3. MapReduce計算過程分析 4. MapReduce用戶擴展接口編程實踐 5. MapReduce部署管理實踐 6. MapReduce配置優(yōu)化與案例分析 |
Hive原理與應用實踐(1H) |
1. SQL轉(zhuǎn)換MapReduce原理分析 2. Hive核心組件與處理流程分析 3. Hive部署管理實踐 4. 大數(shù)據(jù)在線分析Hive應用實踐 5. Hive SQL優(yōu)化與配置優(yōu)化 |
Spark原理與實踐(2H) |
1. Spark編程模型及部署模型 2. Spark運行原理及調(diào)度機制 3. Spark性能優(yōu)化及最佳實踐 |
Hadoop周邊產(chǎn)品討論(0.5H) |
1. Hadoop基準測試工具Hibench 2. Hadoop性能測試工具HiTune 3. Hadoop性能分析工具Dew |
Hadoop大數(shù)據(jù)平臺架構(gòu)(1H) |
1. 阿里巴巴大數(shù)據(jù)平臺架構(gòu)分析 2. 騰訊大數(shù)據(jù)平臺架構(gòu)分析 3. 百度大數(shù)據(jù)平臺架構(gòu)分析 |
大數(shù)據(jù)分析實踐(1.5H) |
1. 用戶行為數(shù)據(jù)打點與采集系統(tǒng)架構(gòu) 2. 互聯(lián)網(wǎng)大數(shù)據(jù)分析常用方法 3. 數(shù)據(jù)分析案例 |
大數(shù)據(jù)與機器學習(1.5H) |
1. 大數(shù)據(jù)分類與聚類算法 2. 推薦引擎算法實踐 3. 神經(jīng)網(wǎng)絡原理與應用 |
Hadoop生態(tài)系統(tǒng)概述(1H) 1. 分布式文件系統(tǒng)HDFS 2. 分布式計算MapReduce 3. 分布式資源管理Yarn 4. 大數(shù)據(jù)SQL分析引擎Hive 5. 分布式機器學習與數(shù)據(jù)挖掘Mahout 6. NoSQL引擎HBase 7. 分布式一致性框架ZooKeeper 8. 高性能大數(shù)據(jù)引擎Spark |
HDFS原理與應用實踐(2H) 1. HDFS高可用可伸縮架構(gòu)原理分析 2. HDFS配置與部署實踐 3. HDFS API編程實踐 |
MapReduce原理與應用實踐(2H) 1. MapReduce編程模型與案例分析 2. MapReduce核心組件分析 3. MapReduce計算過程分析 4. MapReduce用戶擴展接口編程實踐 5. MapReduce部署管理實踐 6. MapReduce配置優(yōu)化與案例分析 |
Hive原理與應用實踐(1H) 1. SQL轉(zhuǎn)換MapReduce原理分析 2. Hive核心組件與處理流程分析 3. Hive部署管理實踐 4. 大數(shù)據(jù)在線分析Hive應用實踐 5. Hive SQL優(yōu)化與配置優(yōu)化 |
Spark原理與實踐(2H) 1. Spark編程模型及部署模型 2. Spark運行原理及調(diào)度機制 3. Spark性能優(yōu)化及最佳實踐 |
Hadoop周邊產(chǎn)品討論(0.5H) 1. Hadoop基準測試工具Hibench 2. Hadoop性能測試工具HiTune 3. Hadoop性能分析工具Dew |
Hadoop大數(shù)據(jù)平臺架構(gòu)(1H) 1. 阿里巴巴大數(shù)據(jù)平臺架構(gòu)分析 2. 騰訊大數(shù)據(jù)平臺架構(gòu)分析 3. 百度大數(shù)據(jù)平臺架構(gòu)分析 |
大數(shù)據(jù)分析實踐(1.5H) 1. 用戶行為數(shù)據(jù)打點與采集系統(tǒng)架構(gòu) 2. 互聯(lián)網(wǎng)大數(shù)據(jù)分析常用方法 3. 數(shù)據(jù)分析案例 |
大數(shù)據(jù)與機器學習(1.5H) 1. 大數(shù)據(jù)分類與聚類算法 2. 推薦引擎算法實踐 3. 神經(jīng)網(wǎng)絡原理與應用 |