課程簡介
本課程旨在深入剖析大模型技術的發(fā)展脈絡,從機器學習源起、小模型到大模型的演進,到GPT與閉源大模型的崛起,以及開源社區(qū)的進展,全面展現(xiàn)大模型技術的全貌。同時,課程將結合實踐案例,詳細講解大模型的基礎技術理解、訓練與推理、推理優(yōu)化以及應用開發(fā)等方面的知識,幫助學員掌握大模型應用與開發(fā)的核心技能。此外,課程還將關注大模型在研發(fā)生產實踐中的應用,探討大模型時代下的研發(fā)工序新范式,以及超級開發(fā)者的崛起與成長路徑,為學員提供前瞻性的行業(yè)洞察。
目標收益
培訓對象
課程內容
1.?大模型發(fā)展脈絡
1.1?機器學習源起
1.1.1?機器學習數學基礎
1.1.2?ML之分類算法
1.1.3?ML之聚類算法
1.1.4?深度學習時代下的ML算法
1.1.5?注意力機制與Transformer的崛起
1.2?從小模型到大模型
1.2.1?CV圖像處理算法
1.2.2?NLP自然語言處理算法
1.2.3?從Bert時代到GPT時代
1.3?GPT與閉源大模型
1.3.1?OpenAI歷史回顧
1.3.2?指令學習與強化對齊
1.3.3?從chatGPT到GPT4
1.3.4?從文本到多模態(tài)
1.3.5?Claude、Gemini與其余閉源大模型
1.4?開源社區(qū)的進展
1.4.1?國外開源大模型概覽(llama、Grok、Mistral、Gemma等)
1.4.2?國內開源大模型概覽(通義千問、百川、智譜、kimi等)
1.4.3?MoE技術、多模態(tài)的崛起
1.5?發(fā)展總結與展望
2.?大模型落地實踐
2.1大模型基礎技術理解
2.1.1?常見大模型介紹與網絡結構的統(tǒng)一性
2.1.2?大模型的縮放法則與涌現(xiàn)能力
2.1.3?大模型的基礎訓練過程(預訓練、指令微調、強化學習對齊)
2.1.4?大模型主流預訓練框架介紹(Megatron,Deepspeed。。。)
2.1.5?大模型評價體系(數據集與榜單介紹)
2.2?大模型訓練與推理(?以GLM3-6B為例)
2.2.1基礎權重準備與推理部署
2.2.2?微調數據集準備
2.2.3?全參數微調與Lora微調(數據構造與超參數設定)
2.2.4?垂類模型微調實踐(格式服從案例)
2.3?大模型推理優(yōu)化
2.3.1?大規(guī)模推理成本優(yōu)化(量化、vLLM并行推理)
2.3.2?檢索強化型大模型應用(RAG)
2.3.3?如何針對線上Case修復模型問題
2.3.4?如何利用CoT與Agent機制提升模型效果
2.3.5?大模型安全與風險控制
3.?大模型應用開發(fā)
3.1?開發(fā)框架介紹
3.1.1?Langchain
3.1.2?Dify?與?Coze
3.1.3?其余典型項目介紹
3.2?框架核心模塊入門
3.2.1?基于LLM?Chain的工作流實踐
3.2.2?模板化輸入
3.2.3?框架記憶力機制
3.3?提示詞工程的最佳實踐
3.3.1?基于結構化prompt
3.3.2?基于CoT的prompt優(yōu)化
3.3.3?基于RAG的領域能力提升
3.3.4?基于functionCall的專業(yè)能力提升
3.3.5?基于ReAct框架協(xié)同推理與行動
3.3.6?基于Agent機制強化能力
3.4?RAG模式數據處理流
3.4.1?文檔加載器
3.4.2?文檔轉換器
3.4.3?文檔向量化轉換模型
3.4.4?向量數據庫
3.4.5?檢索器Retrievers
3.5?Agent模式構建復雜應用
3.5.1?函數調用能力functionCall
3.5.2?LLM的推理、規(guī)劃與反思能力
3.5.3?模塊設計與原理實現(xiàn)
3.5.4?當前Agent落地的實踐
4.?大模型Agent應用構建示例
4.1?基于知識庫與圖像生成的營銷顧問
4.2?基于GPT4v/GLM-4V實現(xiàn)多模態(tài)交互
4.3?AgentGPT、AutoGPT?實踐與原理拆解
5.?大模型賦能研發(fā)生產實踐
5.1?大模型時代下的研發(fā)工序新范式
5.1.1?需求分析和設計階段
5.1.2?軟件編碼與測試階段
5.1.3?應用發(fā)布與維護階段
5.1.4?軟件開發(fā)場景大模型應用行業(yè)回顧
5.2?當前大模型落地對研發(fā)人員的要求與挑戰(zhàn)
5.2.1?研發(fā)人員的AI應用水平
5.2.2?研發(fā)人員的業(yè)務理解能力
5.2.3?新技術的敏感度與實踐
5.2.4?研發(fā)管理者的要求
5.3?超級開發(fā)者的崛起與成長路徑
5.3.1?大模型時代下的全棧工程師
5.3.2?業(yè)務理解與需求分析的全棧化
5.3.3?領域特點與模塊化認知
5.3.4?演進式架構設計
5.3.5?端到端研發(fā)交付全流程
5.3.6?開發(fā)者的成長路徑(人人都是開發(fā)者)
5.4?軟件提示工程場景應用與實戰(zhàn)
5.4.1?提示詞工程回顧(Prompt?Engineering)
5.4.1?代碼生成部分:text2SQL、Text2Python
5.4.2?Bug檢測與修復部分:Bugfix、Explain
5.4.3?流程提效部分:產品實踐與技術知識問答
5.5?構建大模型時代下的軟件研發(fā)組織
5.5.1?模型適配&開放框架選型&?場景應用適配
5.5.2?基于人與AI系統(tǒng)的流程實踐
5.5.3?研發(fā)數據資產和知識管理
5.5.4?數據隱私保護與安全合規(guī)
5.5.5?專業(yè)能力與組織分工演進