工程師
互聯(lián)網(wǎng)
其他
創(chuàng)新
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

Sora類技術(shù)的崛起:視覺(jué)化生成—業(yè)務(wù)場(chǎng)景中的創(chuàng)新引擎

某互聯(lián)網(wǎng)大廠 AIGC負(fù)責(zé)人

任某互聯(lián)網(wǎng)公司AIGC負(fù)責(zé)人,負(fù)責(zé)大模型、多模態(tài)、產(chǎn)研落地與知識(shí)管理與評(píng)估等多個(gè)團(tuán)隊(duì)工作。
多年百度搜索、大數(shù)據(jù)工作經(jīng)驗(yàn),專注于自然語(yǔ)言處理與人工智能方向,曾獲CCKS中文知識(shí)圖譜大賽第一名,就職期間輸出數(shù)十篇專利。
帶領(lǐng)團(tuán)隊(duì)發(fā)布內(nèi)容行業(yè)垂類模型,并通過(guò)網(wǎng)信辦備案。在多模態(tài)內(nèi)容理解、角色對(duì)話、視頻生成等多個(gè)方向有場(chǎng)景落地,有大量一線實(shí)操經(jīng)驗(yàn),AIGC業(yè)務(wù)單日服務(wù)用戶超50萬(wàn)。
對(duì)市面上大部分大模型基座有比較深入的了解,能判斷模型的能力邊界。擅長(zhǎng)結(jié)合行業(yè)垂類的實(shí)際情況,挖掘大模型可賦能的業(yè)務(wù)場(chǎng)景。有落地AIGC與大模型業(yè)務(wù)的一手經(jīng)驗(yàn),從模型的訓(xùn)練微調(diào),到算力部署推理,以及線上實(shí)際用戶case的反饋跟進(jìn),熟悉生產(chǎn)環(huán)境的具體實(shí)施。此外,也掌握大模型風(fēng)控和網(wǎng)信辦備案過(guò)程,能有效幫助企業(yè)在生產(chǎn)環(huán)境中落地大模型。

任某互聯(lián)網(wǎng)公司AIGC負(fù)責(zé)人,負(fù)責(zé)大模型、多模態(tài)、產(chǎn)研落地與知識(shí)管理與評(píng)估等多個(gè)團(tuán)隊(duì)工作。 多年百度搜索、大數(shù)據(jù)工作經(jīng)驗(yàn),專注于自然語(yǔ)言處理與人工智能方向,曾獲CCKS中文知識(shí)圖譜大賽第一名,就職期間輸出數(shù)十篇專利。 帶領(lǐng)團(tuán)隊(duì)發(fā)布內(nèi)容行業(yè)垂類模型,并通過(guò)網(wǎng)信辦備案。在多模態(tài)內(nèi)容理解、角色對(duì)話、視頻生成等多個(gè)方向有場(chǎng)景落地,有大量一線實(shí)操經(jīng)驗(yàn),AIGC業(yè)務(wù)單日服務(wù)用戶超50萬(wàn)。 對(duì)市面上大部分大模型基座有比較深入的了解,能判斷模型的能力邊界。擅長(zhǎng)結(jié)合行業(yè)垂類的實(shí)際情況,挖掘大模型可賦能的業(yè)務(wù)場(chǎng)景。有落地AIGC與大模型業(yè)務(wù)的一手經(jīng)驗(yàn),從模型的訓(xùn)練微調(diào),到算力部署推理,以及線上實(shí)際用戶case的反饋跟進(jìn),熟悉生產(chǎn)環(huán)境的具體實(shí)施。此外,也掌握大模型風(fēng)控和網(wǎng)信辦備案過(guò)程,能有效幫助企業(yè)在生產(chǎn)環(huán)境中落地大模型。

課程費(fèi)用

6800.00 /人

課程時(shí)長(zhǎng)

3小時(shí)

成為教練

課程簡(jiǎn)介

本課程將帶領(lǐng)您深入探索Sora類技術(shù)的崛起,理解其在業(yè)務(wù)場(chǎng)景中的創(chuàng)新引擎作用。我們將從Sora類技術(shù)的核心特點(diǎn)出發(fā),詳細(xì)剖析其靈活的視頻時(shí)間長(zhǎng)度、分辨率、寬高比,以及強(qiáng)大的文本理解能力和視頻編輯能力。同時(shí),我們還將探討鏡頭3D一致性、物體角色持久一致性等關(guān)鍵技術(shù),以及游戲數(shù)字世界模擬和圖生視頻等前沿應(yīng)用。

目標(biāo)收益

培訓(xùn)對(duì)象

課程內(nèi)容

1. 引子~Sora介紹?
1.1?內(nèi)容特點(diǎn):靈活的視頻時(shí)間長(zhǎng)度、分辨率、寬高比
1.2?文本理解能力
1.3?視頻編輯能力
1.4?鏡頭3D一致性
1.5?物體角色持久一致性
1.6?游戲數(shù)字世界模擬
1.7?圖生視頻
1.8?局限
2. AI視頻生成技術(shù)迭代?
2.1?VDM:Video?Diffusion?Models(google)
2.2?Make-A-Video
2.3?Imagen?Video
2.4?Video?LDM
2.5?AnimateDiff
2.6?Show-1
2.7?SVD:Stable?Video?Diffusion
2.8?NaViT/Vivit/DiT
2.8?Sora技術(shù)分析?與?opensora
3.1?行業(yè)發(fā)展概覽
3.2?生產(chǎn)端典型公司介紹:runway&pika&pixelverse
3.3?業(yè)務(wù)應(yīng)用端典型公司介紹:Tavus&奧創(chuàng)光年&各類工作室(AI我中華)
4. 真實(shí)工業(yè)環(huán)境下的多模態(tài)落地實(shí)踐
4.1??圖片模態(tài):
4.1.1?可控生圖?的技術(shù)落地介紹
4.1.2?IP形象復(fù)刻與可控生成衍生品
4.1.3?多格漫畫(huà)的生成與翻譯
4.1.4?頭像規(guī)模化生成
4.1.5?社區(qū)可控配圖
4.1.6?規(guī)?;鷪D推理成本控制
4.2?虛擬人模態(tài):
4.2.1?聲音克隆
4.2.2?虛擬IP互動(dòng)唱歌
4.2.3?數(shù)字分身制作
4.3?視頻模態(tài):
4.3.1?動(dòng)態(tài)漫畫(huà)視頻
4.3.2?短劇剪輯:視頻剪輯與自動(dòng)解說(shuō)
4.3.3?短劇出海:視頻換臉、翻譯與對(duì)嘴型
5. 行業(yè)垂類落地核心環(huán)節(jié)建設(shè)
5.1?文案:商品理解與營(yíng)銷短語(yǔ)
5.2?創(chuàng)意:劇本與創(chuàng)意模板
5.3?視覺(jué)化:生圖與視頻
5.4?GPU集群:選型、部署與推理加速

6. 展望
6.1?落地合規(guī)與安全展望
6.2?從多模態(tài)輸入到多模態(tài)輸出

活動(dòng)詳情

提交需求