光學AI圖像生成器能耗降至毫焦級

2025年08月29日09:15 | 來源：科技日報222

小字號

科技日報北京8月28日電（記者劉霞）美國加州大學洛杉磯分校研究團隊在新一期《自然》雜志刊發論文稱，他們研制出一種新型圖像生成器，其利用光束而非傳統計算硬件來生成圖像。與標准人工智能（AI）工具相比，該設備生成一幅圖像的能耗可降低至十萬分之一，僅幾毫焦耳。

目前大多數AI模型基於文本生成圖像時，通常採用所謂“擴散”方法：AI先學習大量圖像，掌握如何用統計噪聲逐步破壞它們，再將這類變化模式編碼為一套規則。當接收到新的含噪聲圖像時，AI可依據這些規則反向操作，經過多步處理，最終生成與文本指令相匹配的連貫圖像。

然而，生成高分辨率逼真圖像需要執行大量擴散步驟，對算力要求極高，能耗巨大。以美國開放人工智能研究中心（OpenAI）為例，其新型圖像生成器在運行第一周內生成了超過7億張圖像。為滿足這一需求，需要消耗大量能源和水，用於供電和冷卻運行模型的機器。新型光學AI圖像生成器或能緩解能耗巨大這一難題。

研究團隊表示，傳統數字擴散模型需經歷數百至數千次迭代，才能生成圖像，而新系統除初始編碼外，無需任何額外計算。該系統首先使用基於公開圖像數據集訓練的數字編碼器，生成可轉化為圖像的靜態編碼。隨后，借助名為“空間光調制器（SLM）”的液晶屏幕，將該編碼以物理方式印刻在激光束中。當激光穿過第二個用作解碼的SLM時，便會在相機記錄的屏幕上瞬間呈現目標圖像。

在測試中，團隊利用新系統生成了黑白數字（1至9）、基礎服裝等簡單圖像，以及梵高風格的全彩畫作。結果顯示，生成效果與傳統圖像生成器大致相當。在繪制梵高風格圖像時，新系統每幅僅消耗約幾毫焦耳能量，而傳統擴散模型則需耗費數百甚至數千焦耳。

團隊稱，盡管這一系統仍需進一步優化才能替代當前廣泛使用的圖像生成工具，但其低功耗特性尤其適合可穿戴設備（如AI眼鏡）等應用場景。

(責編：羅知之、李楠樺)

關注公眾號：人民網財經