可靈AI推出“多圖參考”功能 進(jìn)一步攻克AI視頻一致性難題
近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個圖片中的不同主體,根據(jù)用戶的文字描述,創(chuàng)造性地生成融合視頻,進(jìn)一步攻克了AI視頻生成中的一致性難題。
2025-01-23 15:06:26
來源:丁科技網(wǎng)??

近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個圖片中的不同主體,根據(jù)用戶的文字描述,創(chuàng)造性地生成融合視頻,進(jìn)一步攻克了AI視頻生成中的一致性難題。

目前,全球用戶均可在可靈1.6模型下,使用“多圖參考”功能。用戶只需選擇圖生視頻,上傳1-4張參考圖,框選圖片中需要使用的人物、動物、物品或場景,并通過“提示詞”描述它們之間的變化或互動,可靈AI即可結(jié)合所有參考內(nèi)容并遵從指令生成視頻。

用戶可以上傳一張或多張同一主體(人物、動物、影視角色或物品等)的圖片,模型會以這些圖片為參考,生成統(tǒng)一風(fēng)格的視頻,幫助用戶在制作AI視頻時保證多鏡頭中的主體一致。例如,用戶上傳貓、夾克、太陽鏡三張圖片,并輸入提示詞“一只身穿夾克、戴著太陽鏡的擬人化貓在舞臺上轉(zhuǎn)身并對著鏡頭擺姿勢,”隨后進(jìn)行生成,就可以得到符合指令的視頻。

此外,用戶還可以通過參考圖來指定場景、服裝和動作等,讓人物在特定環(huán)境中完成特定“演出”,大幅提升創(chuàng)作的可控性。例如,我們分別上傳一個老爺爺、一杯咖啡、咖啡館場景三張參考圖片,并輸入相應(yīng)提示詞“一個卡通風(fēng)格的老爺爺在咖啡館里,端起咖啡杯”來進(jìn)行生成,便可得到老爺爺坐在咖啡館里喝咖啡的視頻 。

同時,“多圖參考”還可以支持不同角色之間的互動。用戶可以上傳多個人物、動物或者影視角色等圖片,并用文字描述他們之間的互動。例如,我們分別上傳小男孩、柯基犬兩張參考圖,并輸入提示詞“一個可愛的小男孩在撫摸一只柯基犬”,即可生成下圖所示的視頻。

此前,可靈AI已在全球上線“人臉模型”功能,支持用戶通過上傳多段視頻來訓(xùn)練、定制人臉模型,并參照該人臉模型繼續(xù)生成視頻內(nèi)容。作為業(yè)內(nèi)首個視頻模型定制功能,“人臉模型”創(chuàng)新性地滿足了用戶創(chuàng)作多個包含同一人物鏡頭的需求。

隨著“多圖參考”功能的推出,可靈AI進(jìn)一步解決了視頻生成中的一致性難題,幫助用戶充分發(fā)揮創(chuàng)造力,自由組合各種圖片元素,打造獨(dú)特的創(chuàng)意場景,探索更多可能。

最新文章
1
海信家電2024年報:新風(fēng)空調(diào)市占率第一 進(jìn)入AI空氣管家時代
2
2025快手磁力大會:加速“生成新商業(yè)”,AI全面重塑商業(yè)經(jīng)營
3
三星推出AI神家電,中國家電的AI智慧生活解決方案何時到來?
4
索尼集團(tuán)成員Aniplex上海線下店煥新開業(yè),開創(chuàng)IP+沉浸互動新空間
5
2025中國國際消費(fèi)電子博覽會(CICE)德國推介會在柏林成功舉辦
6
DeepSeek的低成本神話后,云大廠們?yōu)楹芜€要增加算力投入
7
AI智啟生活 第15屆深圳國際移動電子展亮點(diǎn)“劇透”
8
4年前理想李想和特斯拉陶琳說的話,值得所有人深思
9
TCL上新Mini LED電視,T7L為何“最能打”,Q9L為何“最值得買”?
10
八年前用A9帶火屏幕發(fā)聲技術(shù)的索尼,今年會有OLED新品嗎?
11
海信視像發(fā)布2024年可持續(xù)發(fā)展報告:以綠色科技推動可持續(xù)發(fā)展
12
都叫“養(yǎng)鮮”冰箱,格力、容聲有啥不一樣?
13
財報觀察:2024全球智能家電銷量第一品牌,講好新故事?
14
續(xù)航滅霸 +倍強(qiáng)大 vivo Y300 Pro+正式發(fā)布
15
BOE(京東方)f-OLED柔性顯示技術(shù)策源地論壇舉辦 攜手中關(guān)村論壇共筑科技創(chuàng)新高地
16
海信視像2024年營收凈利雙增,高端穩(wěn)步增長,蟬聯(lián)世界第二
17
精裝修熱水系統(tǒng)市場外資占優(yōu),高端住宅需求點(diǎn)燃新增長(2025年1-2月)
18
AI家電:技術(shù)狂歡還是實用革命?
19
中國半導(dǎo)體并購潮起
20
小家電市場表現(xiàn)低迷,2025年小家電市場面臨嚴(yán)峻挑戰(zhàn)
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512