互聯(lián)網(wǎng)
大數(shù)據(jù)
SQL
Spark
HBase
大數(shù)據(jù)平臺
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

大數(shù)據(jù)實戰(zhàn)培訓

中科院 大數(shù)據(jù)技術專家

有著豐富的IT方面從業(yè)經(jīng)驗,擁有8年上市互聯(lián)網(wǎng)公司軟件研發(fā)經(jīng)驗,曾任職獵豹移動大數(shù)據(jù)技術專家,對離線和實時數(shù)據(jù)計算有深入理解。曾參與開發(fā)海外互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng),在獵豹移動任職期間帶領團隊開發(fā)了海量日志數(shù)據(jù)采集系統(tǒng)、OLAP數(shù)據(jù)分析平臺、數(shù)據(jù)倉庫構(gòu)建、PB級日志檢索系統(tǒng)等。曾前往北京航天智能科技、上海文思海輝為技術工程師進行培訓,受到公司和員工好評。受邀成為鄭州工業(yè)應用學院特聘大數(shù)據(jù)講師。

有著豐富的IT方面從業(yè)經(jīng)驗,擁有8年上市互聯(lián)網(wǎng)公司軟件研發(fā)經(jīng)驗,曾任職獵豹移動大數(shù)據(jù)技術專家,對離線和實時數(shù)據(jù)計算有深入理解。曾參與開發(fā)海外互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng),在獵豹移動任職期間帶領團隊開發(fā)了海量日志數(shù)據(jù)采集系統(tǒng)、OLAP數(shù)據(jù)分析平臺、數(shù)據(jù)倉庫構(gòu)建、PB級日志檢索系統(tǒng)等。曾前往北京航天智能科技、上海文思海輝為技術工程師進行培訓,受到公司和員工好評。受邀成為鄭州工業(yè)應用學院特聘大數(shù)據(jù)講師。

課程費用

5800.00 /人

課程時長

2

成為教練

課程簡介

本次課程主要針對大數(shù)據(jù)平臺中MapReduce,Spark中的Spark core、Spark SQL 、SparkStreaming、Spark性能優(yōu)化,以及HBase的高級特性這些內(nèi)容進行講解,通過這些內(nèi)容的學習,可以掌握MapReduce的編程思想,掌握Spark中的離線計算和實時計算,以及HBase的高級特性。

目標收益

?了解大數(shù)據(jù)中MapReduce的核心原理
?掌握MapReduce核心編程
?了解Spark性能優(yōu)化
?掌握Spark中的離線計算和實時計算
?掌握Spark SQL的使用
?掌握HBase的高級特性

培訓對象

課程內(nèi)容

第一天(上午)
Hadoop原理及HDFS實操
1 快速了解Hadoop
2 Hadoop3.x的核心細節(jié)優(yōu)化
3 Hadoop大數(shù)據(jù)平臺的選型
4 HDFS核心原理詳解
5 HDFS的常用及高級shell命令
6 HDFS體系結(jié)構(gòu)原理詳細剖析
HDFS高級內(nèi)容
7 HDFS的回收站和安全模式
8 HDFS的高可用和高擴展架構(gòu)剖析
9 HDFS機架感知策略原理剖析
10 HDFS寫數(shù)據(jù)原理及源碼剖析
11 HDFS的糾刪碼機制(Erasure Coding)原理剖析
第一天(下午)
MapReduce核心編程
1 MapReduce原理深度剖析
2 MapReduce實戰(zhàn)案例開發(fā)
3 Shuffle過程詳解
4 Hadoop中的序列化機制分析
5 MapTask源碼分析
6 RecuceTask源碼分析
7 YARN資源管理模型分析
8 YARN中的多資源隊列配置和使用
MapReduce源碼剖析及性能優(yōu)化解決方案
9 Inputformat切片源碼分析
10 Outputformat源碼分析
11 小文件問題剖析及實戰(zhàn)
12 數(shù)據(jù)傾斜問題原理剖析及實戰(zhàn)
13 MapReduce Job提交流程分析
14 Map job和Reduce join案例分析及實戰(zhàn)
15 MapReduce中的數(shù)據(jù)壓縮案例分析及實戰(zhàn)
第二天(上午)
Spark原理及案例開發(fā)
1 Spark核心原理及架構(gòu)剖析
2 Spark任務的三種提交模式

活動詳情

提交需求