工程師
互聯網
其他
創(chuàng)新
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

Sora類技術的崛起:視覺化生成—業(yè)務場景中的創(chuàng)新引擎

某互聯網大廠 AIGC負責人

任某互聯網公司AIGC負責人,負責大模型、多模態(tài)、產研落地與知識管理與評估等多個團隊工作。
多年百度搜索、大數據工作經驗,專注于自然語言處理與人工智能方向,曾獲CCKS中文知識圖譜大賽第一名,就職期間輸出數十篇專利。
帶領團隊發(fā)布內容行業(yè)垂類模型,并通過網信辦備案。在多模態(tài)內容理解、角色對話、視頻生成等多個方向有場景落地,有大量一線實操經驗,AIGC業(yè)務單日服務用戶超50萬。
對市面上大部分大模型基座有比較深入的了解,能判斷模型的能力邊界。擅長結合行業(yè)垂類的實際情況,挖掘大模型可賦能的業(yè)務場景。有落地AIGC與大模型業(yè)務的一手經驗,從模型的訓練微調,到算力部署推理,以及線上實際用戶case的反饋跟進,熟悉生產環(huán)境的具體實施。此外,也掌握大模型風控和網信辦備案過程,能有效幫助企業(yè)在生產環(huán)境中落地大模型。

任某互聯網公司AIGC負責人,負責大模型、多模態(tài)、產研落地與知識管理與評估等多個團隊工作。 多年百度搜索、大數據工作經驗,專注于自然語言處理與人工智能方向,曾獲CCKS中文知識圖譜大賽第一名,就職期間輸出數十篇專利。 帶領團隊發(fā)布內容行業(yè)垂類模型,并通過網信辦備案。在多模態(tài)內容理解、角色對話、視頻生成等多個方向有場景落地,有大量一線實操經驗,AIGC業(yè)務單日服務用戶超50萬。 對市面上大部分大模型基座有比較深入的了解,能判斷模型的能力邊界。擅長結合行業(yè)垂類的實際情況,挖掘大模型可賦能的業(yè)務場景。有落地AIGC與大模型業(yè)務的一手經驗,從模型的訓練微調,到算力部署推理,以及線上實際用戶case的反饋跟進,熟悉生產環(huán)境的具體實施。此外,也掌握大模型風控和網信辦備案過程,能有效幫助企業(yè)在生產環(huán)境中落地大模型。

課程費用

6800.00 /人

課程時長

3小時

成為教練

課程簡介

本課程將帶領您深入探索Sora類技術的崛起,理解其在業(yè)務場景中的創(chuàng)新引擎作用。我們將從Sora類技術的核心特點出發(fā),詳細剖析其靈活的視頻時間長度、分辨率、寬高比,以及強大的文本理解能力和視頻編輯能力。同時,我們還將探討鏡頭3D一致性、物體角色持久一致性等關鍵技術,以及游戲數字世界模擬和圖生視頻等前沿應用。

目標收益

培訓對象

課程內容

1. 引子~Sora介紹?
1.1?內容特點:靈活的視頻時間長度、分辨率、寬高比
1.2?文本理解能力
1.3?視頻編輯能力
1.4?鏡頭3D一致性
1.5?物體角色持久一致性
1.6?游戲數字世界模擬
1.7?圖生視頻
1.8?局限
2. AI視頻生成技術迭代?
2.1?VDM:Video?Diffusion?Models(google)
2.2?Make-A-Video
2.3?Imagen?Video
2.4?Video?LDM
2.5?AnimateDiff
2.6?Show-1
2.7?SVD:Stable?Video?Diffusion
2.8?NaViT/Vivit/DiT
2.8?Sora技術分析?與?opensora
3.1?行業(yè)發(fā)展概覽
3.2?生產端典型公司介紹:runway&pika&pixelverse
3.3?業(yè)務應用端典型公司介紹:Tavus&奧創(chuàng)光年&各類工作室(AI我中華)
4. 真實工業(yè)環(huán)境下的多模態(tài)落地實踐
4.1??圖片模態(tài):
4.1.1?可控生圖?的技術落地介紹
4.1.2?IP形象復刻與可控生成衍生品
4.1.3?多格漫畫的生成與翻譯
4.1.4?頭像規(guī)?;?br /> 4.1.5?社區(qū)可控配圖
4.1.6?規(guī)?;鷪D推理成本控制
4.2?虛擬人模態(tài):
4.2.1?聲音克隆
4.2.2?虛擬IP互動唱歌
4.2.3?數字分身制作
4.3?視頻模態(tài):
4.3.1?動態(tài)漫畫視頻
4.3.2?短劇剪輯:視頻剪輯與自動解說
4.3.3?短劇出海:視頻換臉、翻譯與對嘴型
5. 行業(yè)垂類落地核心環(huán)節(jié)建設
5.1?文案:商品理解與營銷短語
5.2?創(chuàng)意:劇本與創(chuàng)意模板
5.3?視覺化:生圖與視頻
5.4?GPU集群:選型、部署與推理加速

6. 展望
6.1?落地合規(guī)與安全展望
6.2?從多模態(tài)輸入到多模態(tài)輸出

課程費用

6800.00 /人

課程時長

3小時

預約體驗票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求