光学AI图像生成器能耗降至毫焦级


科技日报北京8月28日电 (记者刘霞)美国加州大学洛杉矶分校研究团队在新一期《自然》杂志刊发论文称,他们研制出一种新型图像生成器,其利用光束而非传统计算硬件来生成图像。与标准人工智能(AI)工具相比,该设备生成一幅图像的能耗可降低至十万分之一,仅几毫焦耳。
目前大多数AI模型基于文本生成图像时,通常采用所谓“扩散”方法:AI先学习大量图像,掌握如何用统计噪声逐步破坏它们,再将这类变化模式编码为一套规则。当接收到新的含噪声图像时,AI可依据这些规则反向操作,经过多步处理,最终生成与文本指令相匹配的连贯图像。
然而,生成高分辨率逼真图像需要执行大量扩散步骤,对算力要求极高,能耗巨大。以美国开放人工智能研究中心(OpenAI)为例,其新型图像生成器在运行第一周内生成了超过7亿张图像。为满足这一需求,需要消耗大量能源和水,用于供电和冷却运行模型的机器。新型光学AI图像生成器或能缓解能耗巨大这一难题。
研究团队表示,传统数字扩散模型需经历数百至数千次迭代,才能生成图像,而新系统除初始编码外,无需任何额外计算。该系统首先使用基于公开图像数据集训练的数字编码器,生成可转化为图像的静态编码。随后,借助名为“空间光调制器(SLM)”的液晶屏幕,将该编码以物理方式印刻在激光束中。当激光穿过第二个用作解码的SLM时,便会在相机记录的屏幕上瞬间呈现目标图像。
在测试中,团队利用新系统生成了黑白数字(1至9)、基础服装等简单图像,以及梵高风格的全彩画作。结果显示,生成效果与传统图像生成器大致相当。在绘制梵高风格图像时,新系统每幅仅消耗约几毫焦耳能量,而传统扩散模型则需耗费数百甚至数千焦耳。
团队称,尽管这一系统仍需进一步优化才能替代当前广泛使用的图像生成工具,但其低功耗特性尤其适合可穿戴设备(如AI眼镜)等应用场景。

分享让更多人看到
推荐阅读
- “DATA 之夜”:具身未来 向新绽放
- 中国数谷 今夜璀璨 8月28日 “2025数博会·DATA之夜” 在贵州贵阳震撼启幕 近200位与会嘉宾奔赴现场 “DATA之夜”成为了 全球数智领域精英代表思想碰撞 与产业对接的舞台 走进活动现场 科技感随处可见 人形机器人灵活穿梭 四足机器人平地奔跑 智能电动汽车跟随音乐起舞 具身智能的魅力在此绽放 数智前沿科技在此汇聚 与此同时 来自贵阳的咖啡香气 和“非遗”侗族大歌 为与会嘉宾 带来听觉与味觉的双重感官体验 由人民网和贵州大数据集团联合打造的 “王阳明”数字人 “穿越”500年时光 与主持人对话 人民网数字人白泽 运用AI技术 将每一位思辨人的观点 凝聚成“数据筑基·具身向新”的共识 “DATA之夜”的帷幕缓缓落下 但数据驱动的创新脚步从未停歇 具身智能 未来已来.…
- 评论
- 关注