-->
可靈AI推出“多圖參考”功能 進一步攻克AI視頻一致性難題
近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個圖片中的不同主體,根據用戶的文字描述,創(chuàng)造性地生成融合視頻,進一步攻克了AI視頻生成中的一致性難題。
2025-01-23 15:06:26
來源:丁科技網??

近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個圖片中的不同主體,根據用戶的文字描述,創(chuàng)造性地生成融合視頻,進一步攻克了AI視頻生成中的一致性難題。

目前,全球用戶均可在可靈1.6模型下,使用“多圖參考”功能。用戶只需選擇圖生視頻,上傳1-4張參考圖,框選圖片中需要使用的人物、動物、物品或場景,并通過“提示詞”描述它們之間的變化或互動,可靈AI即可結合所有參考內容并遵從指令生成視頻。

用戶可以上傳一張或多張同一主體(人物、動物、影視角色或物品等)的圖片,模型會以這些圖片為參考,生成統(tǒng)一風格的視頻,幫助用戶在制作AI視頻時保證多鏡頭中的主體一致。例如,用戶上傳貓、夾克、太陽鏡三張圖片,并輸入提示詞“一只身穿夾克、戴著太陽鏡的擬人化貓在舞臺上轉身并對著鏡頭擺姿勢,”隨后進行生成,就可以得到符合指令的視頻。

此外,用戶還可以通過參考圖來指定場景、服裝和動作等,讓人物在特定環(huán)境中完成特定“演出”,大幅提升創(chuàng)作的可控性。例如,我們分別上傳一個老爺爺、一杯咖啡、咖啡館場景三張參考圖片,并輸入相應提示詞“一個卡通風格的老爺爺在咖啡館里,端起咖啡杯”來進行生成,便可得到老爺爺坐在咖啡館里喝咖啡的視頻 。

同時,“多圖參考”還可以支持不同角色之間的互動。用戶可以上傳多個人物、動物或者影視角色等圖片,并用文字描述他們之間的互動。例如,我們分別上傳小男孩、柯基犬兩張參考圖,并輸入提示詞“一個可愛的小男孩在撫摸一只柯基犬”,即可生成下圖所示的視頻。

此前,可靈AI已在全球上線“人臉模型”功能,支持用戶通過上傳多段視頻來訓練、定制人臉模型,并參照該人臉模型繼續(xù)生成視頻內容。作為業(yè)內首個視頻模型定制功能,“人臉模型”創(chuàng)新性地滿足了用戶創(chuàng)作多個包含同一人物鏡頭的需求。

隨著“多圖參考”功能的推出,可靈AI進一步解決了視頻生成中的一致性難題,幫助用戶充分發(fā)揮創(chuàng)造力,自由組合各種圖片元素,打造獨特的創(chuàng)意場景,探索更多可能。

最新文章
1
杜比攜手QQ音樂 以杜比AC-4全新升級功能推動音樂流媒體體驗
2
追覓之后,國內頭部品牌3LCoS投影或三季度上市,競爭格局再變?
3
“新能源光伏+智能家電”比翼齊飛,兩大黑電巨頭“增長密碼”找到了
4
五年實現1億套下線!TCL空調廣州智能制造基地正式投產
5
以全鏈生態(tài)之力共創(chuàng)產業(yè)新勢“頭” 愛普生打印頭大會擘畫消費市場新圖景
6
影像級彩繪賦能個性出行 愛普生微噴車藝方案全新升級
7
極米科技Global Summit 2026圓滿落幕:從“走出去”到“請進來”,戰(zhàn)略升維背后的深意
8
今天,國產半導體設備批量上新
9
內冷外壓、成本暴漲!空調行業(yè)進入更為復雜的階段
10
硬核技術扎堆發(fā)布,盤點推動電視行業(yè)進入高品質畫質時代的技術
11
4月新機前瞻:影像與性能齊發(fā)力,多款重磅機型集中登場
12
智能體主機:AMD押注的下一個計算范式
13
一個時代落幕!盧偉冰回應小米MIUI停更:向全生態(tài)AIOS加速前進
14
國產旗艦手機CMOS來了!思特威SC5A6XS發(fā)布:5000萬像素、1英寸大底
15
AI“融入”庭院陽臺光儲,華寶新能在家庭綠電新賽道“一路狂飆”
16
vivo X300s輕體驗:隨身攜帶的“小V單”,三“超”的全能旗艦
17
泡泡瑪特咖啡機吹風機“降維殺到”,傳統(tǒng)小家電這場仗不好打
18
東芝原色RGB Mini LED全矩陣出擊,日系電視巨頭續(xù)寫“真實”傳奇
19
七十余年真實音畫積淀再跨越:東芝電視開啟“原色RGB Mini LED”新紀元
20
以原色破局 以真實立境 東芝REGZA新品開啟視聽新世代
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512