打開

首頁
黨政
- 黨網 · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
觀點
互動
可視化
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陝
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
民文
English
合作網站
人工智能
人民網客戶端
網站無障礙
舉報
登錄

退出

人民網>>經濟·科技

可靈2.1首尾幀功能上線破解AI視頻轉場難題

2025年08月22日16:43 | 來源：環球網222

小字號

原標題：可靈2.1首尾幀功能上線破解AI視頻轉場難題

8月22日，可靈AI推出基於2.1模型的全新首尾幀功能。該功能通過升級端到端多模態語義推理能力，提升了首尾幀視頻生成效果。據評測數據，與1.6版本相比，效果提升235%，在視頻轉場、視覺呈現、運鏡處理及營銷素材制作等方面表現突出。

優化轉場表現實現多場景自然銜接

可靈2.1模型首尾幀功能的核心改進之一，是改善AI視頻生成中常見的轉場問題，如場景銜接生硬、有“剎車感”等。

測試視頻顯示，一名年輕亞洲女性從堆滿書籍與佛像的房間轉身，鏡頭推進至金色裝飾漸多的空間，過程中角色發型（長發自然垂落轉為側梳）、服裝（白色長袖襯衫變為無袖上衣）、光線（暖光由散射轉為聚焦）實現無縫銜接，場景切換邏輯連貫。該案例通過多個首尾幀相接完成連續轉場，體現了模型對藝術風格切換與角色動態銜接的把控能力。

增強視覺呈現提升畫面表現力

可靈2.1首尾幀功能在視覺呈現上有提升，能輔助制作具有張力的視覺效果。

實測視頻中，人物輪廓在深藍背景中逐步變為火焰形態，火山岩漿流動、星空下烈焰升騰等細節清晰，節奏與危險緊張的氛圍匹配，顯示出模型對復雜視覺元素的控制能力。

支持專業運鏡增強觀看沉浸感

可靈2.1首尾幀功能支持專業級復雜運鏡，通過首尾幀連續銜接，實現鏡頭軌跡與場景邏輯的匹配。

例如，在模型連續生成的視頻中，鏡頭先快速向左下搖鏡，突出趴在地上爬行的破舊機器人，隨后快速左搖，拍攝逃竄機器人與爆炸場景，整個鏡頭調度流暢連貫，提升了觀看的沉浸感。

助力創意營銷降低素材制作成本

升級后的首尾幀功能可快速生成符合品牌調性的創意展示視頻，適用於市場營銷等領域，有助於降低素材制作成本。

在一個飲品廣告案例中，易拉罐從樹莓中快速飛出，周圍樹莓如爆炸般散開，果汁向四周飛濺，過程自然，給觀眾帶來沉浸式體驗。

專業評估人員對可靈2.1、可靈1.6、Seedance1.0 mini、Midjourney等模型的首尾幀功能進行了效果評測。結果顯示，可靈2.1在整體效果及多個細分維度上表現較好：與Seedance1.0 mini對比的整體GSB得分達2.09，與Midjourney對比的整體GSB得分達2.30，與可靈1.6對比的整體GSB得分達3.35﹔在與Midjourney、Seedance1.0 mini的兩兩偏好對比中，可靈2.1的勝率分別為62%、57%。

這一表現得益於可靈2.1在端到端優化的多模態語義推理能力上的提升。模型能深度整合用戶提示詞與首尾幀圖片中的視覺語義及動作意圖，融合多模態數據，捕捉並推理畫面元素在時空維度上的演變邏輯，在藝術風格切換、角色銜接、復雜運鏡與場景遷移等方面，生成自然流暢的動態畫面。

同時，可靈2.1引入自適應擴散引導與方向重定向機制，在擴散生成的每一步對條件分布進行動態引導和糾正，修正偏離語義或視覺邏輯的動態路徑，確保動作銜接平滑、運動節奏穩定可控。

此外，模型在生成過程中保持人物/物體身份一致性、色彩風格與畫面基調連貫，提升了視頻的專業質感。面對高動態場景下的局部失真、細節破碎、縮放變形及首尾幀視覺跳變等問題，該機制能有效抑制和糾正錯誤，保障生成內容的穩定性。

作為AI創意生產力平台，可靈AI已完成30次迭代，服務用戶超4500萬，累計生成視頻超2億條、圖片超4億張，覆蓋廣告、影視、游戲等多個行業。此次2.1模型首尾幀功能的推出，提升了視頻生成的一致性和穩定性，適用於廣告營銷、影視、短劇、動畫等創意制作場景，進一步鞏固了其在AI視頻生成領域的地位。

(責編：董童、李源)

關注公眾號：人民網財經

分享讓更多人看到

人民日報報系

旗下網站

創新服務平台

可靈2.1首尾幀功能上線破解AI視頻轉場難題

推薦閱讀

客戶端下載

熱門排行

人民日報報系

旗下網站

創新服務平台

可靈2.1首尾幀功能上線 破解AI視頻轉場難題

推薦閱讀

客戶端下載

熱門排行

可靈2.1首尾幀功能上線破解AI視頻轉場難題