課程簡介
本課程主要介紹數據科學常用的技術、算法和應用案例。課程包括數據科學應用概述、平臺架構、常見數據分析方法;數據挖掘常用的算法、模型及案例實踐;大數據生態(tài)系統(tǒng)介紹等。
目標收益
通過本課程的學習,希望學員能夠在了解和掌握數據科學相關理論的基礎上,學會應用數據科學技術、算法、模型解決現(xiàn)實數據處理、分析、挖掘和應用落地等問題。
培訓對象
數據分析、挖掘、開發(fā)等相關崗位從業(yè)者、初級入門者、欲轉型數據工作者、欲了解大數據在行業(yè)中的應用現(xiàn)狀和動態(tài)的管理者等等。
課程大綱
第1-2天 基礎課程 1.數據科學概述 |
1)數據科學應用概述 2)大數據平臺架構 3)大數據平臺常規(guī)功能 |
2.數據挖掘算法與模型 |
1)數據挖掘概述與案例展示 2)聚類算法與案例實踐 基于劃分的聚類算法與案例實踐 基于層次的聚類算法與案例實踐 基于密度的聚類算法與案例實踐 3)分類算法與案例實踐 基礎分類算法與案例實踐 組合分類算法與案例實踐 高級分類算法與案例實踐 4)關聯(lián)規(guī)則與案例實踐 Apriori算法、FP-growth算法 關聯(lián)規(guī)則分析案例實踐 5)預測算法與案例實踐 多元回歸分析與案例實踐 時間序列分析與案例實踐 |
第3-4天 進階課程 3.網絡挖掘理論與實踐 |
1)網絡挖掘概念 2)網絡挖掘常用算法 3)網絡挖掘實踐 |
4.文本挖掘與WEB挖掘 |
1)從數據挖掘到文本挖掘 2)文本特征表示與提取 3)文本挖掘常用方法 4) web挖掘概述 5)文本挖掘實踐 |
5.推薦系統(tǒng)理論與實踐 |
1)推薦系統(tǒng)概述 2)常見推薦方法與算法原理 3)推薦系統(tǒng)評測 4)推薦算法實踐 |
6.大數據生態(tài)系統(tǒng)介紹 |
1)Hadoop生態(tài)系統(tǒng)介紹 2)Spark生態(tài)系統(tǒng)介紹 3)深度學習框架大比拼 |
第1-2天 基礎課程 1.數據科學概述 1)數據科學應用概述 2)大數據平臺架構 3)大數據平臺常規(guī)功能 |
2.數據挖掘算法與模型 1)數據挖掘概述與案例展示 2)聚類算法與案例實踐 基于劃分的聚類算法與案例實踐 基于層次的聚類算法與案例實踐 基于密度的聚類算法與案例實踐 3)分類算法與案例實踐 基礎分類算法與案例實踐 組合分類算法與案例實踐 高級分類算法與案例實踐 4)關聯(lián)規(guī)則與案例實踐 Apriori算法、FP-growth算法 關聯(lián)規(guī)則分析案例實踐 5)預測算法與案例實踐 多元回歸分析與案例實踐 時間序列分析與案例實踐 |
第3-4天 進階課程 3.網絡挖掘理論與實踐 1)網絡挖掘概念 2)網絡挖掘常用算法 3)網絡挖掘實踐 |
4.文本挖掘與WEB挖掘 1)從數據挖掘到文本挖掘 2)文本特征表示與提取 3)文本挖掘常用方法 4) web挖掘概述 5)文本挖掘實踐 |
5.推薦系統(tǒng)理論與實踐 1)推薦系統(tǒng)概述 2)常見推薦方法與算法原理 3)推薦系統(tǒng)評測 4)推薦算法實踐 |
6.大數據生態(tài)系統(tǒng)介紹 1)Hadoop生態(tài)系統(tǒng)介紹 2)Spark生態(tài)系統(tǒng)介紹 3)深度學習框架大比拼 |