開發(fā)經(jīng)理
電商
大數(shù)據(jù)
云計(jì)算
變革
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

數(shù)據(jù)湖構(gòu)建實(shí)戰(zhàn)

李虎翼

前阿里巴巴 計(jì)算平臺(tái)Staff Engineer

硅谷海歸軟件工程師、架構(gòu)師,主要研究方向是分布式系統(tǒng)、大數(shù)據(jù)系統(tǒng)及數(shù)據(jù)挖掘;
10年以上從事大數(shù)據(jù)基礎(chǔ)設(shè)施研發(fā);
曾供職阿里巴巴云梯、飛天及計(jì)算平臺(tái)任高級(jí)技術(shù)專家;
參與阿里云梯、飛天、5K、計(jì)算平臺(tái)等系統(tǒng)研發(fā)并任核心成員;
曾在硅谷TangoMe從事數(shù)據(jù)基礎(chǔ)設(shè)施研發(fā),是國(guó)內(nèi)最早參與大數(shù)據(jù)研究的軟件工程師之一;
擁有《Hadoop硬實(shí)戰(zhàn)》《Hadoop MapReduce實(shí)戰(zhàn)手冊(cè)》等多本著作,及MPICH2-Yarn、大數(shù)據(jù)恢復(fù)系統(tǒng)等多項(xiàng)專利。

硅谷海歸軟件工程師、架構(gòu)師,主要研究方向是分布式系統(tǒng)、大數(shù)據(jù)系統(tǒng)及數(shù)據(jù)挖掘; 10年以上從事大數(shù)據(jù)基礎(chǔ)設(shè)施研發(fā); 曾供職阿里巴巴云梯、飛天及計(jì)算平臺(tái)任高級(jí)技術(shù)專家; 參與阿里云梯、飛天、5K、計(jì)算平臺(tái)等系統(tǒng)研發(fā)并任核心成員; 曾在硅谷TangoMe從事數(shù)據(jù)基礎(chǔ)設(shè)施研發(fā),是國(guó)內(nèi)最早參與大數(shù)據(jù)研究的軟件工程師之一; 擁有《Hadoop硬實(shí)戰(zhàn)》《Hadoop MapReduce實(shí)戰(zhàn)手冊(cè)》等多本著作,及MPICH2-Yarn、大數(shù)據(jù)恢復(fù)系統(tǒng)等多項(xiàng)專利。

課程費(fèi)用

5800.00 /人

課程時(shí)長(zhǎng)

3小時(shí)

成為教練

課程簡(jiǎn)介

大數(shù)據(jù)存儲(chǔ)已經(jīng)走到了一個(gè)新的階段,肯定會(huì)有新的革命性技術(shù)來替換它,而數(shù)據(jù)湖就是大數(shù)據(jù)的下一個(gè)變革。業(yè)界趨勢(shì)是從傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)向數(shù)據(jù)湖的方向演進(jìn).

數(shù)據(jù)湖構(gòu)建實(shí)戰(zhàn),基于目前大數(shù)據(jù)領(lǐng)域流行的數(shù)據(jù)湖技術(shù)及方案,結(jié)合數(shù)據(jù)湖在知名互聯(lián)網(wǎng)及云計(jì)算公司的構(gòu)建案例,從理論和實(shí)戰(zhàn)的角度介紹數(shù)據(jù)湖的構(gòu)建及應(yīng)用。

目標(biāo)收益

從實(shí)戰(zhàn)角度解密流行的數(shù)據(jù)湖技術(shù)及構(gòu)建方案,使企業(yè)快速構(gòu)建數(shù)據(jù)湖能力,降低試錯(cuò)的成本。幫助企業(yè)厘清數(shù)據(jù)湖概念,解決大數(shù)據(jù)應(yīng)用實(shí)戰(zhàn)中的問題。

培訓(xùn)對(duì)象

課程內(nèi)容

1.數(shù)據(jù)湖是什么湖?
a)什么是數(shù)據(jù)湖
b)原始數(shù)據(jù)保存的問題
c)與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別
d)數(shù)據(jù)湖的關(guān)鍵技術(shù)
e)數(shù)據(jù)沼澤與數(shù)據(jù)治理
f)數(shù)據(jù)河與數(shù)據(jù)源

2.數(shù)據(jù)湖的架構(gòu)及戰(zhàn)略分析
a)數(shù)據(jù)湖的常見架構(gòu)
b)與數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系和并存
c)數(shù)據(jù)湖與Hadoop的關(guān)系
d)數(shù)據(jù)湖與原始數(shù)據(jù)的關(guān)系
e)數(shù)據(jù)湖與大數(shù)據(jù)
f)數(shù)據(jù)湖的安全保障
g)數(shù)據(jù)湖與元數(shù)據(jù)

3.數(shù)據(jù)湖技術(shù)分析與實(shí)戰(zhàn)
a)Apache Hadoop數(shù)據(jù)湖的基礎(chǔ)
b)Apache Kafka數(shù)據(jù)河流的基礎(chǔ)
c)Apache Hudi數(shù)據(jù)湖存儲(chǔ)
d)Apache Ranger數(shù)據(jù)湖安全
e)Apache Atlas數(shù)據(jù)湖治理與元數(shù)據(jù)

4.數(shù)據(jù)湖的案例分析
a)開源Hadoop數(shù)據(jù)湖案例分析
b)Amazon數(shù)據(jù)湖案例分析
c)阿里云EMR數(shù)據(jù)湖案例分析
d)阿里飛天數(shù)據(jù)湖案例分析
e)微軟Data lake as service案例分析

5.未來的發(fā)展
a)下一代數(shù)據(jù)倉(cāng)庫(kù)
b)AI驅(qū)動(dòng)
c)決策自動(dòng)化

活動(dòng)詳情

提交需求