課程簡介
目標收益
通過本課程的教學,使學員充分了解和認識大數(shù)據(jù)的相關知識(大數(shù)據(jù)的應用范圍及相關技術思想),同時學會用主流的數(shù)據(jù)挖掘軟件完成數(shù)據(jù)挖掘建模任務,使學員掌握數(shù)據(jù)挖掘方法論CRISP-DM的本質。通過幾個具體的、典型的數(shù)據(jù)挖掘案例,使學員在掌握這些案例所用的技巧的同時,充分理解數(shù)據(jù)挖掘的方法論,實現(xiàn)舉一反三的效果,提高學員分析問題解決問題的實際能力。
培訓對象
課程大綱
大數(shù)據(jù)的介紹 |
1.1 什么是大數(shù)據(jù):海量非結構化數(shù)據(jù)本身+處理方法 1.2 大數(shù)據(jù)為什么重要及大數(shù)據(jù)帶來的機遇:決定公司是否有未來和業(yè)務可延伸范圍 1.3 對大數(shù)據(jù)的深層理解:組成、特點介紹 1.4 大數(shù)據(jù)的相關技術與應用案例 數(shù)據(jù)采集:ETL工具 數(shù)據(jù)存?。宏P系數(shù)據(jù)庫;NoSQL、SQL等 基礎架構支持:云存儲;分布式文件系統(tǒng)等 計算結果展現(xiàn):云計算;標簽云;關系圖等 1.5 大數(shù)據(jù)專題可能的演進路徑 |
數(shù)據(jù)分析基礎 |
2.1 數(shù)據(jù)分析的含義、主要做什么? 2.2 為什么要學習做好數(shù)據(jù)分析 2.2.1從數(shù)據(jù)分析的描述問題、對比問題、分析問題 到最后解決問題說明為什么要做好 2.2.2通過案例說明一般人員與數(shù)據(jù)分析師的區(qū)別 2.3 數(shù)據(jù)分析的誤區(qū)和分析的關鍵 2.4 數(shù)據(jù)分析的6個步驟,3大方向(理清思路,尋找答案,觀點表達)案例形式詳細說明 步驟1:需求明確--理清思路 步驟2:數(shù)據(jù)收集--理清思路 步驟3:數(shù)據(jù)處理--尋找答案 步驟4:數(shù)據(jù)分析--尋找答案 步驟5:數(shù)據(jù)展示--觀點表達 步驟6:報表撰寫--觀點表達 分別對以上6個步驟以案例的方式詳細說明。 2.5 實踐:以數(shù)據(jù)分析項目為引,將數(shù)據(jù)分析的技能與業(yè)務結合,并應用于實際的工作之中 |
數(shù)據(jù)挖掘基礎 |
3.1 數(shù)據(jù)挖掘概述、基本理念、歷史發(fā)展進程、主要功能、發(fā)展趨勢 3.2 數(shù)據(jù)挖掘方法論:CRISP-DM、SEMMA 3.3 數(shù)據(jù)處理過程:變量的分類及類型,數(shù)據(jù)的質量、理解過程、準備過程 |
數(shù)據(jù)挖掘及數(shù)據(jù)分析技術 |
4.1.數(shù)據(jù)挖掘主要分析方法: 4.1.1 聚類分析(Clustering) 4.1.2 分類分析(Classification) 4.1.3 關聯(lián)分析(Association) 4.1.4 預測分析(Prediction) 4.1.5 回歸分析 4.1.6 相關分析 4.1.7數(shù)據(jù)比較分析 4.1.8 數(shù)據(jù)挖掘的可視化 4.2 數(shù)據(jù)挖掘的實施 4.3 分析圖形:正態(tài)性檢驗 描述性統(tǒng)計 箱型圖、區(qū)間圖、時序圖介紹 4.4 數(shù)據(jù)挖掘的關鍵技術:數(shù)據(jù)預處理 4.5 數(shù)據(jù)挖掘效果的評估 4.6 實踐:SPSS結合相應的分析算法及展示圖形 |
構建**數(shù)據(jù)挖掘分析體系 |
5.1 分析團隊建設 5.2 分析工作管理 5.3 數(shù)據(jù)分析核心能力建設 5.4 分析工作與業(yè)務協(xié)同 |
數(shù)據(jù)挖掘應用 |
6.1 數(shù)據(jù)挖掘及管理經(jīng)驗 6.2 數(shù)據(jù)挖掘在***行業(yè)領域的應用舉例 6.2.1 客戶行為與潛在客戶分析 6.2.2 用戶信用度分析 6.2.3 趨勢預測 6.2.4 新產(chǎn)品交叉營銷分析 等 6.3 數(shù)據(jù)挖掘實踐舉例:客戶流失、趨勢發(fā)展分析等(結合SPSS軟件) 6.4 實踐:內容包括(從設計->形成模型->應用). |
數(shù)據(jù)挖掘工具及未來研究的方向和熱點 |
7.1 幾種數(shù)據(jù)挖掘工具比較 7.2 典型工具介紹及使用范圍 7.3 如何選擇數(shù)據(jù)挖掘工具 7.4 數(shù)據(jù)挖掘的方向和熱點 |
大數(shù)據(jù)的介紹 1.1 什么是大數(shù)據(jù):海量非結構化數(shù)據(jù)本身+處理方法 1.2 大數(shù)據(jù)為什么重要及大數(shù)據(jù)帶來的機遇:決定公司是否有未來和業(yè)務可延伸范圍 1.3 對大數(shù)據(jù)的深層理解:組成、特點介紹 1.4 大數(shù)據(jù)的相關技術與應用案例 數(shù)據(jù)采集:ETL工具 數(shù)據(jù)存?。宏P系數(shù)據(jù)庫;NoSQL、SQL等 基礎架構支持:云存儲;分布式文件系統(tǒng)等 計算結果展現(xiàn):云計算;標簽云;關系圖等 1.5 大數(shù)據(jù)專題可能的演進路徑 |
數(shù)據(jù)分析基礎 2.1 數(shù)據(jù)分析的含義、主要做什么? 2.2 為什么要學習做好數(shù)據(jù)分析 2.2.1從數(shù)據(jù)分析的描述問題、對比問題、分析問題 到最后解決問題說明為什么要做好 2.2.2通過案例說明一般人員與數(shù)據(jù)分析師的區(qū)別 2.3 數(shù)據(jù)分析的誤區(qū)和分析的關鍵 2.4 數(shù)據(jù)分析的6個步驟,3大方向(理清思路,尋找答案,觀點表達)案例形式詳細說明 步驟1:需求明確--理清思路 步驟2:數(shù)據(jù)收集--理清思路 步驟3:數(shù)據(jù)處理--尋找答案 步驟4:數(shù)據(jù)分析--尋找答案 步驟5:數(shù)據(jù)展示--觀點表達 步驟6:報表撰寫--觀點表達 分別對以上6個步驟以案例的方式詳細說明。 2.5 實踐:以數(shù)據(jù)分析項目為引,將數(shù)據(jù)分析的技能與業(yè)務結合,并應用于實際的工作之中 |
數(shù)據(jù)挖掘基礎 3.1 數(shù)據(jù)挖掘概述、基本理念、歷史發(fā)展進程、主要功能、發(fā)展趨勢 3.2 數(shù)據(jù)挖掘方法論:CRISP-DM、SEMMA 3.3 數(shù)據(jù)處理過程:變量的分類及類型,數(shù)據(jù)的質量、理解過程、準備過程 |
數(shù)據(jù)挖掘及數(shù)據(jù)分析技術 4.1.數(shù)據(jù)挖掘主要分析方法: 4.1.1 聚類分析(Clustering) 4.1.2 分類分析(Classification) 4.1.3 關聯(lián)分析(Association) 4.1.4 預測分析(Prediction) 4.1.5 回歸分析 4.1.6 相關分析 4.1.7數(shù)據(jù)比較分析 4.1.8 數(shù)據(jù)挖掘的可視化 4.2 數(shù)據(jù)挖掘的實施 4.3 分析圖形:正態(tài)性檢驗 描述性統(tǒng)計 箱型圖、區(qū)間圖、時序圖介紹 4.4 數(shù)據(jù)挖掘的關鍵技術:數(shù)據(jù)預處理 4.5 數(shù)據(jù)挖掘效果的評估 4.6 實踐:SPSS結合相應的分析算法及展示圖形 |
構建**數(shù)據(jù)挖掘分析體系 5.1 分析團隊建設 5.2 分析工作管理 5.3 數(shù)據(jù)分析核心能力建設 5.4 分析工作與業(yè)務協(xié)同 |
數(shù)據(jù)挖掘應用 6.1 數(shù)據(jù)挖掘及管理經(jīng)驗 6.2 數(shù)據(jù)挖掘在***行業(yè)領域的應用舉例 6.2.1 客戶行為與潛在客戶分析 6.2.2 用戶信用度分析 6.2.3 趨勢預測 6.2.4 新產(chǎn)品交叉營銷分析 等 6.3 數(shù)據(jù)挖掘實踐舉例:客戶流失、趨勢發(fā)展分析等(結合SPSS軟件) 6.4 實踐:內容包括(從設計->形成模型->應用). |
數(shù)據(jù)挖掘工具及未來研究的方向和熱點 7.1 幾種數(shù)據(jù)挖掘工具比較 7.2 典型工具介紹及使用范圍 7.3 如何選擇數(shù)據(jù)挖掘工具 7.4 數(shù)據(jù)挖掘的方向和熱點 |