人民網
人民網>>經濟·科技

0.5秒內精准識別480余種果蔬 菜市場裡視覺AI顯身手

符曉波
2024年01月09日07:57 | 來源:科技日報
小字號

視覺AI可以通過攝像頭或傳感器來“感知”外部世界,能將捕捉到的圖像或視頻數據進行特征提取和分析,最后通過機器深度學習來區分不同物體和特征。一旦系統學會了如何識別圖像中的物體,視覺AI就可以根據這些信息自動作出決策或響應。

近日,廈門浩森威視科技有限公司CEO李密向科技日報記者展示了正在訓練的視覺AI“大顯身手”的新場景。設計團隊介紹,他們將視覺傳感器安裝在普通電子秤上,通過先進的算法設計,使視覺AI能迅速將物品與數據庫中的圖像進行匹配,從而實現精准識別。這款搭載了視覺傳感器和算法的智能電子秤能夠在0.5秒內精准識別480余種果蔬,並自動完成稱重結算。

不同於標准化產品擁有唯一的二維碼信息,散稱果蔬種類龐雜、顏色外形容易混淆,同類果蔬的形態也因成熟度不同而存在差異。這對算法技術提出了很高的要求。為此,該團隊不斷完善算法,持續訓練模型,進行了數次迭代和優化。

“通過算法設計,我們讓機器能夠像人類一樣‘看見’並理解‘看見’的世界。”李密說,其核心技術在於先進的算法中台,能以圖片數量較少的圖庫讓機器完成深度學習。

李密介紹,通常人們在菜市場購買果蔬時,都需要人工稱重結算。而有了這台智能電子秤,顧客隻需自行將散裝商品放在秤上掃描,攝像頭捕捉到圖像后,便能迅速識別出商品種類,配合系統完成自動稱重結算。這一場景的推廣和普及將極大提高零售業的結賬效率,不僅節省了人力,也優化了顧客的購物體驗。

能自動識別商品的電子秤、能矯正坐姿的台燈、能精准找出工業產品微小缺陷的系統……當前,從家居到工廠生產,視覺AI在多個創新場景中展現出強大潛力。近年來,該團隊將深度學習大模型與成像技術相結合,深耕工業檢測、智能識別等,已開發出10余種AI應用並用於多個場景,覆蓋工業及民用領域。

作為“百度AI技術生態伙伴”之一,廈門浩森威視科技有限公司目前正著手與百度共同深入探索不同領域大模型的創新應用。在李密看來,相較於文本AI,視覺AI能夠處理的信息量更大、產品效果更加直觀,可應用場景多,市場潛力巨大。“隨著計算能力的增強和算法的不斷進步,視覺AI將在更多細分領域的創新場景中發揮關鍵作用。無論是在復雜的工業檢測中,還是在精密的醫療診斷中,視覺AI都將成為提高效率和准確性的強大工具。”李密說。

(責編:申佳平、陳鍵)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

返回頂部