可靈2.1首尾幀功能上線 破解AI視頻轉場難題


8月22日,可靈AI推出基於2.1模型的全新首尾幀功能。該功能通過升級端到端多模態語義推理能力,提升了首尾幀視頻生成效果。據評測數據,與1.6版本相比,效果提升235%,在視頻轉場、視覺呈現、運鏡處理及營銷素材制作等方面表現突出。
優化轉場表現 實現多場景自然銜接
可靈2.1模型首尾幀功能的核心改進之一,是改善AI視頻生成中常見的轉場問題,如場景銜接生硬、有“剎車感”等。
測試視頻顯示,一名年輕亞洲女性從堆滿書籍與佛像的房間轉身,鏡頭推進至金色裝飾漸多的空間,過程中角色發型(長發自然垂落轉為側梳)、服裝(白色長袖襯衫變為無袖上衣)、光線(暖光由散射轉為聚焦)實現無縫銜接,場景切換邏輯連貫。該案例通過多個首尾幀相接完成連續轉場,體現了模型對藝術風格切換與角色動態銜接的把控能力。
增強視覺呈現 提升畫面表現力
可靈2.1首尾幀功能在視覺呈現上有提升,能輔助制作具有張力的視覺效果。
實測視頻中,人物輪廓在深藍背景中逐步變為火焰形態,火山岩漿流動、星空下烈焰升騰等細節清晰,節奏與危險緊張的氛圍匹配,顯示出模型對復雜視覺元素的控制能力。
支持專業運鏡 增強觀看沉浸感
可靈2.1首尾幀功能支持專業級復雜運鏡,通過首尾幀連續銜接,實現鏡頭軌跡與場景邏輯的匹配。
例如,在模型連續生成的視頻中,鏡頭先快速向左下搖鏡,突出趴在地上爬行的破舊機器人,隨后快速左搖,拍攝逃竄機器人與爆炸場景,整個鏡頭調度流暢連貫,提升了觀看的沉浸感。
助力創意營銷 降低素材制作成本
升級后的首尾幀功能可快速生成符合品牌調性的創意展示視頻,適用於市場營銷等領域,有助於降低素材制作成本。
在一個飲品廣告案例中,易拉罐從樹莓中快速飛出,周圍樹莓如爆炸般散開,果汁向四周飛濺,過程自然,給觀眾帶來沉浸式體驗。
專業評估人員對可靈2.1、可靈1.6、Seedance1.0 mini、Midjourney等模型的首尾幀功能進行了效果評測。結果顯示,可靈2.1在整體效果及多個細分維度上表現較好:與Seedance1.0 mini對比的整體GSB得分達2.09,與Midjourney對比的整體GSB得分達2.30,與可靈1.6對比的整體GSB得分達3.35﹔在與Midjourney、Seedance1.0 mini的兩兩偏好對比中,可靈2.1的勝率分別為62%、57%。
這一表現得益於可靈2.1在端到端優化的多模態語義推理能力上的提升。模型能深度整合用戶提示詞與首尾幀圖片中的視覺語義及動作意圖,融合多模態數據,捕捉並推理畫面元素在時空維度上的演變邏輯,在藝術風格切換、角色銜接、復雜運鏡與場景遷移等方面,生成自然流暢的動態畫面。
同時,可靈2.1引入自適應擴散引導與方向重定向機制,在擴散生成的每一步對條件分布進行動態引導和糾正,修正偏離語義或視覺邏輯的動態路徑,確保動作銜接平滑、運動節奏穩定可控。
此外,模型在生成過程中保持人物/物體身份一致性、色彩風格與畫面基調連貫,提升了視頻的專業質感。面對高動態場景下的局部失真、細節破碎、縮放變形及首尾幀視覺跳變等問題,該機制能有效抑制和糾正錯誤,保障生成內容的穩定性。
作為AI創意生產力平台,可靈AI已完成30次迭代,服務用戶超4500萬,累計生成視頻超2億條、圖片超4億張,覆蓋廣告、影視、游戲等多個行業。此次2.1模型首尾幀功能的推出,提升了視頻生成的一致性和穩定性,適用於廣告營銷、影視、短劇、動畫等創意制作場景,進一步鞏固了其在AI視頻生成領域的地位。

分享讓更多人看到
- 評論
- 關注