課程簡介
在人工智能技術(shù)高速發(fā)展的今天,大模型已成為推動產(chǎn)業(yè)變革的核心引擎,但其安全風(fēng)險也日益凸顯。本課程聚焦大模型全生命周期的安全威脅與防御體系,結(jié)合前沿技術(shù)動態(tài)、真實(shí)案例與全球治理政策,為學(xué)員提供系統(tǒng)性攻防知識框架,助力掌握AI安全領(lǐng)域的核心競爭力。
目標(biāo)收益
1.從技術(shù)到合規(guī),系統(tǒng)性守護(hù)大模型全流程安全;
2.用真實(shí)案例經(jīng)驗(yàn),快速定位并解決高危漏洞;
3.以權(quán)威評估方法,驗(yàn)證模型安全性與可靠性;
4.站在行業(yè)前沿,應(yīng)對AI安全領(lǐng)域快速迭代的挑戰(zhàn)
培訓(xùn)對象
AI研發(fā)工程師、安全運(yùn)維人員、企業(yè)技術(shù)決策者、政策研究人員,以及希望深入理解大模型安全風(fēng)險與防御策略的專業(yè)人士。
課程大綱
大模型安全演進(jìn)與技術(shù)革新 |
1.大模型起源與未來分析 2.deep seek的工程創(chuàng)新點(diǎn) |
大模型安全威脅概況 |
大模型全生命周期安全威脅 1)數(shù)據(jù)層風(fēng)險 2)訓(xùn)練層風(fēng)險 3)推理部署層風(fēng)險 4)迭代優(yōu)化風(fēng)險 |
大模型全球治理和法律法規(guī) |
1.各國人工智能政策法規(guī) 2.中國人工智能安全政策與標(biāo)準(zhǔn)解讀 3.大模型備案和違規(guī)案例 4.典型司法案例 |
數(shù)據(jù)投毒攻擊 |
1.數(shù)據(jù)污染與篡改 1)偽造訓(xùn)練樣本 2)隱蔽性投毒 2.惡意代碼注入 1)數(shù)據(jù)集腳本攻擊 2)利用庫漏洞 3.訓(xùn)練過程干擾 4.供應(yīng)鏈攻擊 |
提示詞注入攻擊 |
1.直接和間接提示詞注入攻擊 2.多模態(tài)提示詞注入攻擊 3.代碼提示詞注入攻擊 4.越獄攻擊 5.提示詞注入實(shí)戰(zhàn) |
大模型生成內(nèi)容安全 |
1.虛假與誤導(dǎo)信息風(fēng)險 2.歧視與偏見風(fēng)險 3.違法與有害內(nèi)容風(fēng)險 4.隱私與數(shù)據(jù)泄露風(fēng)險 5.意識形態(tài)與國家安全風(fēng)險 6.技術(shù)依賴與失控風(fēng)險 |
系統(tǒng)與基礎(chǔ)設(shè)施漏洞 |
1.DDoS攻擊 2.供應(yīng)鏈漏洞 3.API劫持 4.第三方組件漏洞 3)Ollama 遠(yuǎn)程代碼執(zhí)行漏洞 CVE-2024-37032 4)深度學(xué)習(xí)框架PyTorch遠(yuǎn)程代碼執(zhí)行漏洞(CVE-2025-32434) 5)Meta的Llama框架遠(yuǎn)程代碼執(zhí)行漏洞 |
其他安全威脅 |
1.模型竊取 2.模型嫁接 3.大模型深度偽造 |
大模型安全防御研究 |
1.大模型安全防御技術(shù) 2.可靠性技術(shù)研究 3.可控性技術(shù)研究 4.多模態(tài)數(shù)據(jù)中的偏見緩解 |
大模型安全防御實(shí)踐 |
1.國內(nèi)大模型安全防御實(shí)踐 2.Chat-gpt各版本安全防御的改進(jìn)分析 |
大模型安全評估 |
大模型安全評估實(shí)驗(yàn)案例 1)語言模型整體評估 2)SuperCLUE-Safety:中文大模型多輪對抗安全基準(zhǔn) 3)多模態(tài)大模型安全性評估 |
大模型安全演進(jìn)與技術(shù)革新 1.大模型起源與未來分析 2.deep seek的工程創(chuàng)新點(diǎn) |
大模型安全威脅概況 大模型全生命周期安全威脅 1)數(shù)據(jù)層風(fēng)險 2)訓(xùn)練層風(fēng)險 3)推理部署層風(fēng)險 4)迭代優(yōu)化風(fēng)險 |
大模型全球治理和法律法規(guī) 1.各國人工智能政策法規(guī) 2.中國人工智能安全政策與標(biāo)準(zhǔn)解讀 3.大模型備案和違規(guī)案例 4.典型司法案例 |
數(shù)據(jù)投毒攻擊 1.數(shù)據(jù)污染與篡改 1)偽造訓(xùn)練樣本 2)隱蔽性投毒 2.惡意代碼注入 1)數(shù)據(jù)集腳本攻擊 2)利用庫漏洞 3.訓(xùn)練過程干擾 4.供應(yīng)鏈攻擊 |
提示詞注入攻擊 1.直接和間接提示詞注入攻擊 2.多模態(tài)提示詞注入攻擊 3.代碼提示詞注入攻擊 4.越獄攻擊 5.提示詞注入實(shí)戰(zhàn) |
大模型生成內(nèi)容安全 1.虛假與誤導(dǎo)信息風(fēng)險 2.歧視與偏見風(fēng)險 3.違法與有害內(nèi)容風(fēng)險 4.隱私與數(shù)據(jù)泄露風(fēng)險 5.意識形態(tài)與國家安全風(fēng)險 6.技術(shù)依賴與失控風(fēng)險 |
系統(tǒng)與基礎(chǔ)設(shè)施漏洞 1.DDoS攻擊 2.供應(yīng)鏈漏洞 3.API劫持 4.第三方組件漏洞 3)Ollama 遠(yuǎn)程代碼執(zhí)行漏洞 CVE-2024-37032 4)深度學(xué)習(xí)框架PyTorch遠(yuǎn)程代碼執(zhí)行漏洞(CVE-2025-32434) 5)Meta的Llama框架遠(yuǎn)程代碼執(zhí)行漏洞 |
其他安全威脅 1.模型竊取 2.模型嫁接 3.大模型深度偽造 |
大模型安全防御研究 1.大模型安全防御技術(shù) 2.可靠性技術(shù)研究 3.可控性技術(shù)研究 4.多模態(tài)數(shù)據(jù)中的偏見緩解 |
大模型安全防御實(shí)踐 1.國內(nèi)大模型安全防御實(shí)踐 2.Chat-gpt各版本安全防御的改進(jìn)分析 |
大模型安全評估 大模型安全評估實(shí)驗(yàn)案例 1)語言模型整體評估 2)SuperCLUE-Safety:中文大模型多輪對抗安全基準(zhǔn) 3)多模態(tài)大模型安全性評估 |