光學AI圖像生成器能耗降至毫焦級


科技日報北京8月28日電 (記者劉霞)美國加州大學洛杉磯分校研究團隊在新一期《自然》雜志刊發論文稱,他們研制出一種新型圖像生成器,其利用光束而非傳統計算硬件來生成圖像。與標准人工智能(AI)工具相比,該設備生成一幅圖像的能耗可降低至十萬分之一,僅幾毫焦耳。
目前大多數AI模型基於文本生成圖像時,通常採用所謂“擴散”方法:AI先學習大量圖像,掌握如何用統計噪聲逐步破壞它們,再將這類變化模式編碼為一套規則。當接收到新的含噪聲圖像時,AI可依據這些規則反向操作,經過多步處理,最終生成與文本指令相匹配的連貫圖像。
然而,生成高分辨率逼真圖像需要執行大量擴散步驟,對算力要求極高,能耗巨大。以美國開放人工智能研究中心(OpenAI)為例,其新型圖像生成器在運行第一周內生成了超過7億張圖像。為滿足這一需求,需要消耗大量能源和水,用於供電和冷卻運行模型的機器。新型光學AI圖像生成器或能緩解能耗巨大這一難題。
研究團隊表示,傳統數字擴散模型需經歷數百至數千次迭代,才能生成圖像,而新系統除初始編碼外,無需任何額外計算。該系統首先使用基於公開圖像數據集訓練的數字編碼器,生成可轉化為圖像的靜態編碼。隨后,借助名為“空間光調制器(SLM)”的液晶屏幕,將該編碼以物理方式印刻在激光束中。當激光穿過第二個用作解碼的SLM時,便會在相機記錄的屏幕上瞬間呈現目標圖像。
在測試中,團隊利用新系統生成了黑白數字(1至9)、基礎服裝等簡單圖像,以及梵高風格的全彩畫作。結果顯示,生成效果與傳統圖像生成器大致相當。在繪制梵高風格圖像時,新系統每幅僅消耗約幾毫焦耳能量,而傳統擴散模型則需耗費數百甚至數千焦耳。
團隊稱,盡管這一系統仍需進一步優化才能替代當前廣泛使用的圖像生成工具,但其低功耗特性尤其適合可穿戴設備(如AI眼鏡)等應用場景。

分享讓更多人看到
推薦閱讀
- “DATA 之夜”:具身未來 向新綻放
- 中國數谷 今夜璀璨 8月28日 “2025數博會·DATA之夜” 在貴州貴陽震撼啟幕 近200位與會嘉賓奔赴現場 “DATA之夜”成為了 全球數智領域精英代表思想碰撞 與產業對接的舞台 走進活動現場 科技感隨處可見 人形機器人靈活穿梭 四足機器人平地奔跑 智能電動汽車跟隨音樂起舞 具身智能的魅力在此綻放 數智前沿科技在此匯聚 與此同時 來自貴陽的咖啡香氣 和“非遺”侗族大歌 為與會嘉賓 帶來聽覺與味覺的雙重感官體驗 由人民網和貴州大數據集團聯合打造的 “王陽明”數字人 “穿越”500年時光 與主持人對話 人民網數字人白澤 運用AI技術 將每一位思辨人的觀點 凝聚成“數據筑基·具身向新”的共識 “DATA之夜”的帷幕緩緩落下 但數據驅動的創新腳步從未停歇 具身智能 未來已來.…
- 評論
- 關注