GTC2023快手展示視頻畫質(zhì)評估算法等多項前沿技術(shù)和解決方案
日前,在NVIDIA GTC 2023大會上,多位來自快手的技術(shù)專家,展示了一系列前沿技術(shù)及解決方案:涵蓋了從視頻畫質(zhì)提升、數(shù)字人直播及互動解決方案,到定制性能優(yōu)化新框架、針對大型推薦模型的性能優(yōu)化,以及多模態(tài)超大模型在短視頻場景落地等多個話題。 畫質(zhì)提升秘籍 視頻畫質(zhì)評估算法和畫質(zhì)修復(fù)增強方案 快手App每天都要產(chǎn)生數(shù)千萬條新增UGC短視頻內(nèi)容。用戶發(fā)布一條視頻,只需要幾秒鐘,增加一些特效,
2023-03-29 14:12:32
來源:丁科技網(wǎng)??

日前,在NVIDIA GTC 2023大會上,多位來自快手的技術(shù)專家,展示了一系列前沿技術(shù)及解決方案:涵蓋了從視頻畫質(zhì)提升、數(shù)字人直播及互動解決方案,到定制性能優(yōu)化新框架、針對大型推薦模型的性能優(yōu)化,以及多模態(tài)超大模型在短視頻場景落地等多個話題。

畫質(zhì)提升秘籍 視頻畫質(zhì)評估算法和畫質(zhì)修復(fù)增強方案

快手App每天都要產(chǎn)生數(shù)千萬條新增UGC短視頻內(nèi)容。用戶發(fā)布一條視頻,只需要幾秒鐘,增加一些特效,也只需要簡單幾個步驟。但鮮為人知的是,為了提供更加清晰的畫質(zhì),每條短視頻在觸達用戶前都經(jīng)歷了重重“關(guān)卡”,這背后是快手技術(shù)團隊持續(xù)的工程、算法技術(shù)積累。

快手音視頻圖像算法負責(zé)人孫明在《快手視頻質(zhì)量評價和畫質(zhì)增強解決方案》演講中提到,在一條短視頻從生產(chǎn)到消費的整體鏈路上,與畫質(zhì)相關(guān)的主要有拍攝、編輯和服務(wù)端處理這三個階段。同時在下發(fā)到移動端的過程中,視頻畫質(zhì)仍受制于網(wǎng)絡(luò)環(huán)境、帶寬成本、用戶端機型等因素影響。

為解決這個問題,快手針對UGC視頻特性提出了視頻畫質(zhì)評估算法體系(KVQ)和畫質(zhì)修復(fù)增強方案(KRP/KEP)。兩者相輔相成,大幅提升了消費側(cè)畫質(zhì)清晰度。

如何在有限的算力下盡可能把算法效果發(fā)揮到極致,實現(xiàn)降本增效?快手視頻質(zhì)量評價框架使用了AI方法來驅(qū)動算法開發(fā)。“早期我們建立了大量的內(nèi)部測試集,發(fā)現(xiàn)哪怕在數(shù)據(jù)較小的情況下,AI算法仍然比市面上的工具好用,所以后面的迭代主要圍繞在內(nèi)容多樣性、處理多樣性、codec多樣性三個問題來解決?!睂O明表示。

快手畫質(zhì)修復(fù)“秘籍”

現(xiàn)如今KVQ已廣泛應(yīng)用于快手內(nèi)部多個業(yè)務(wù)場景中,如全鏈路質(zhì)量監(jiān)控、基于內(nèi)容的自適應(yīng)處理和編碼、搜索推薦等。同時,在StreamLake業(yè)務(wù)中,KVQ已經(jīng)實現(xiàn)商業(yè)化,并為業(yè)內(nèi)數(shù)家知名公司提供服務(wù)。

數(shù)字人直播及互動解決方案 助力游戲營銷

最近幾年,前沿技術(shù)的革新也逐漸帶動了虛擬技術(shù)的升級??焓忠曈X互動技術(shù)負責(zé)人簡偉華分享的《快手 3D 數(shù)字人直播及互動解決方案》,介紹了快手圍繞3D數(shù)字人,基于快手虛擬世界互動平臺KMIP和快手虛擬演播助手KVS,在直播、社交等領(lǐng)域進行的系列實踐。

以游戲場景為例,數(shù)字人主播使用快手虛擬演播助手(KVS),以3D形象參與到游戲中,除了自己體驗并講解游戲玩法外,用戶也可以在主播的引導(dǎo)下與之進行互動,從而參與游戲進程與結(jié)果,甚至可通過打賞等方式入場,以沉浸式第一人稱視角操控角色。

在技術(shù)的加持下,快手站內(nèi)參與主題游戲虛擬世界互動的中小主播營收增加了50%以上,直播間付費率提升了2倍以上;帶貨方面,情人節(jié)期間,快手官方聯(lián)合多位快手虛擬主播進行的直播帶貨共計4245萬人觀看,最高同時在線達到3萬多人,300萬人互動。

快手稱,希望以3D數(shù)字人的技術(shù)棧支持主播和游戲宣發(fā)生態(tài),實現(xiàn)多端打通,游戲營銷的同時助力直播間個性化互動內(nèi)容的生產(chǎn),與平臺進行深度聯(lián)動。用戶也可直接參與互動,這樣一來,快手既承接了獲取流量的部分,也賦予了游戲平臺新的互動形式。

快手定制性能優(yōu)化新框架

在針對更深層次的算法與模型優(yōu)化方面,快手算法引擎專家門春雷在《基于TensorRT的端到端子圖優(yōu)化框架》的演講中進行詳細闡述,詳細介紹了為用戶提供更便捷服務(wù)的迭代技術(shù)。

據(jù)了解,NVIDIA TensorRT是一個高性能的SDK,用于優(yōu)化通用模型的推理性能。快手AI預(yù)估系統(tǒng)廣泛采用 TensorRT 進行加速計算,然而,工業(yè)模型中有一些非通用子圖,仍存在優(yōu)化空間。

門春雷介紹,為了優(yōu)化這些非通用子圖,快手技術(shù)團隊專門設(shè)計了一種利用AI編譯器優(yōu)化子圖的端到端框架。具體來說,該框架會自動分析和裁剪ONNX-Graph中存在性能瓶頸的子圖,利用AI編譯器對其進行優(yōu)化,并生成代碼以填充到TensorRT插件中。這樣,基于TensorRT的二次開發(fā),能夠進一步提升服務(wù)吞吐,節(jié)省計算資源。

針對大型推薦模型的性能優(yōu)化

作為頭部短視頻平臺,快手日活用戶達3.6億,日均時長超129分鐘。推薦服務(wù)在短視頻、廣告、電商等多項業(yè)務(wù)中都發(fā)揮著重要作用。

軟件架構(gòu)師梁瀟在《針對大型推薦模型的性能優(yōu)化》的演講中表示,面對推薦時效性強和模型過于龐大的問題,快手通過平衡 CPU和GPU的工作負載來優(yōu)化整個系統(tǒng),所有的工作都在同一臺服務(wù)器上完成。這樣做既非常易于部署,也能同時充分利用CPU和GPU資源。

方案的實現(xiàn)關(guān)鍵是將部分負載轉(zhuǎn)移到GPU上。為了做到這一點,首先要深度優(yōu)化CPU算法,并且提升模型在GPU上推理的效率,推理所需的時間越少,就意味著有更多的GPU算力可以用來承載從CPU上遷移的算法。此外,技術(shù)團隊還嘗試在GPU端緩存數(shù)據(jù),從而減少對DRAM的訪問量。

這些優(yōu)化的動作使GPU利用率從20%左右大幅提高到近90%,吞吐量提高了十倍以上,能夠幫助平臺在成本可控的情況下,把效果發(fā)揮到極致,更好地為用戶提供優(yōu)質(zhì)服務(wù)。

ChatGPT熱潮下 加速多模態(tài)超大模型在短視頻場景落地應(yīng)用

今年以來,ChatGPT持續(xù)火爆,讓其背后的多模態(tài)大模型技術(shù)受到更多關(guān)注,也為行業(yè)帶來了諸多AI大模型技術(shù)研究熱潮。超大模型和超級算力結(jié)合加速了技術(shù)的應(yīng)用,大模型已經(jīng)從自然語言處理擴展到計算機視覺、多模態(tài)領(lǐng)域等。

在《多模態(tài)超大模型短視頻場景落地應(yīng)用》這一演講中,張勝卓、韓青長、李杰三位技術(shù)專家介紹,為了解決大模型應(yīng)用中共性問題,快手開展技術(shù)攻關(guān),沉淀了通用的混合并行訓(xùn)練、推理優(yōu)化和模型部署整套解決方案。該方案已在快手的多個場景落地,以較低的資源成本取得了顯著的業(yè)務(wù)收益。

快手技術(shù)團隊稱,通過研究發(fā)現(xiàn),訓(xùn)練時間漫長、推理效率過低、部署相對復(fù)雜是多模態(tài)超大模型工程應(yīng)用的三大攔路虎。為全鏈路解決上述問題,快手圍繞提高模型計算效率和可部署開展技術(shù)攻關(guān),沉淀了通用的混合并行訓(xùn)練、推理優(yōu)化和模型部署整套解決方案。

據(jù)悉,目前多模態(tài)超大模型已在快手的多個場景落地,以較低的資源成本推動業(yè)務(wù)開展,探索出了大模型從訓(xùn)練到落地的技術(shù)路徑。同時,結(jié)合快手海量的視頻資源和多媒體場景,多模態(tài)超大模型可以利用多模態(tài)特征構(gòu)建通用理解能力,應(yīng)用于推薦、廣告、搜索、電商等核心業(yè)務(wù)。

在ChatGPT和GPT-4帶動下,AIGC大火。隨著AI技術(shù)的進一步發(fā)展,大模型以及多模態(tài)模型的商業(yè)化應(yīng)用將進一步加速。十年磨一劍,諸如快手等科技巨頭,將憑借多年提煉的技術(shù)“秘籍”,持續(xù)賦能億萬用戶??焓謨?nèi)部文檔請勿外傳

最新文章
1
“AI+制造”迎來三大突破
2
蘋果2025年-2027年iPhone新機發(fā)展路線圖曝光
3
Manus開放注冊了,PC端智能體拼什么?
4
vivo Y300 GT:7620mAh藍海電池+天璣8400滿血版
5
Manus免費開放注冊:下一個AI爆發(fā)時刻來襲?
6
京東方 CEO 馮強:用一場“技術(shù)、綠色、AI”交織的科技盛宴走向全球舞臺
7
既要隱身,又要C位,冰箱行業(yè)如何拆解用戶需求的“多元方程式”?
8
OLED屏筆記本風(fēng)云突變:份額一年翻倍
9
蘋果官宣iOS 19新功能:腦機接口來了 意念控制iPhone
10
OPPO Pad 4 Pro重磅升級:遠控電腦正式支持Windows
11
BOE(京東方)攜尖端首發(fā)新品亮相2025國際顯示周 以創(chuàng)新技術(shù)定義行業(yè)綠色發(fā)展趨勢
12
美的格力小米領(lǐng)銜第一陣營 618前空調(diào)市場凸顯格局裂變
13
以舊換新疊加“618”大促,短期狂歡后的家電行業(yè)何去何從?
14
NVIDIA與聯(lián)發(fā)科共同打造的PC SoC N1或?qū)⒂贑omputex亮相
15
谷歌確認 Android 16 穩(wěn)定版更新將在六月發(fā)布
16
一季度電視銷售額逆勢增長3.4%,Mini LED電視成回暖動力
17
對華芯片封鎖升級!美國宣布限制GPU用于中國大模型:封鎖華為昇騰AI芯片
18
聯(lián)想筆記本電腦一季度線上銷量、銷額雙第一:領(lǐng)先華為、蘋果
19
2026年蘋果產(chǎn)品迎來革命性升級:折疊屏iPhone/全新MacBook Pro已在路上
20
OPPO Reno14 系列:打造性能美學(xué)新高度,5月15日見!
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512