看阿裡通義千問大模型賦能千行百業——
耳機、玩偶與望遠鏡的故事(“走進民營企業看創新”④)

![]() |
圖為全球開放瞬變望遠鏡陣列(GOTTA)模擬圖。 |
![]() |
2024年9月,賽博創力在杭州阿裡雲雲棲大會上亮相,其推出的具身智能AI互動玩具成為焦點。展台前,一名小男孩正與AI小狗聊天。 |
![]() |
今年1月,阿裡線下快閃活動上,觀眾體驗愛富耳機。 |
一款耳機、一個玩偶、一台天文望遠鏡,在過去這是風馬牛不相及之物。
得益於AI,這三者都變了模樣,互相之間也有了聯系。耳機能做到外語同聲傳譯,也能把語音實時變成文字﹔玩偶能根據自己的形象設定,用相應的語調和性格跟人聊天﹔望遠鏡可以自行將“目光”望向天空,能整理觀測到的數據,還能跟全世界其他望遠鏡協同合作……
它們背后,都有阿裡通義千問大模型的身影。看阿裡這家平台型科技企業的發展,不妨將目光投向阿裡之外。
“所說即所得”
採訪結束后10秒,智能硬件企業艾克思的聯合創始人公瑾發來一個錄音文件、一份錄音文檔整理、一個會議紀要。這是本報記者從業以來,第一次由採訪對象整理錄音。
電話採訪時,公瑾戴著自家新產品“愛富耳機”,採訪過程中,耳機實時錄音並整理文字。經過對比,准確率幾乎接近原話,作為一份採訪記錄,已經可以媲美此前需要花費數小時的人工錄音整理。
整理錄音,只是這個AI耳機的功能之一。去年11月推出的這款耳機,還可以充當AI助理,就在我們談話完成后,它也生成了一份採訪總結。它還可以做同傳,戴著它與外國人聊天,耳機可以實時將對方的話翻譯成中文,連語氣和情緒都同步傳遞。
這也不是全部功能。公瑾告訴記者,在AI支持下的耳機,真正的變化是由用戶需求驅動開發,隨時可能出現全新功能。“硬件雖然是固定的,但后台隨時可以變化,取決於用戶在日常使用中如何與它溝通。”
在智能硬件行業,艾克思已深耕15年,在深圳和杭州有兩個團隊共同開發。深圳團隊負責供應鏈和硬件研發,杭州團隊負責AI模型參數調優、大模型接入、APP及后台開發等工作。
當然,在杭州的團隊還有個優勢,離阿裡更近。
2023年12月,AI耳機項目立項。公瑾說,從一開始,耳機就用到了通義千問大模型的能力和百煉平台的開箱即用能力,將所有信息與數據交由通義千問大模型處理。其中,用到了語義分析、情緒識別等多個模型。
雙方分工明確,艾克思的技術人員負責耳機硬件及應用程序的開發,阿裡負責大模型的開發。“我們完成數據採集和數據通道工作,然后數據都在阿裡雲服務器處理及開發。”
比如,錄音轉文字時,一個很重要的需求是非常低的延時,最好是“所說即所得”。在雙方合作之下,艾克思與阿裡雲四五個研發部門同時合作,僅僅用了一個星期時間,就將延時從500毫秒降到30毫秒,對於用戶來說,幾乎已經感受不到延時。就在我們講話的同時,錄音文字稿已經同步出現在手機屏幕上。
再比如,耳機上的同聲傳譯功能,實際上是從外文語音到中文語音的直接翻譯,而不是先將外文翻譯成中文文字,再輸出中文語音。其所依賴的,也是大模型對語音的處理能力、對聊天上下文的理解能力,這在過去很難想象。
在很多方面,中國企業已經進入無人區,AI耳機就是其中一例。這意味著,有很多問題需要摸索著解決。艾克思與阿裡雲的團隊互相配合,基本每天都會有一個小型會議,絕大多數問題當天能得到反饋。
“對於今天的硬件公司來說,自己去做大模型的基座研究沒有太大價值,因為更新迭代太快了。”公瑾告訴記者,“所以找到一個非常可信賴的、高水平大模型合作方,對我們至關重要”。
如今,雙方合作越來越成熟,已經可以用更快的方式、更低的成本將AI接入產品。公瑾認為,如果再做下一款AI耳機產品,研發周期將從過去的兩年,變成“頂多一兩個月”。
新“聊天搭子”
“賽博大舞台……”
北京市昌平區,中國移動園區內,這段語音在十平方米的辦公室裡此起彼伏地響起。辦公室裡,擺滿桌子、椅子、電腦和玩偶。此刻是早上十時,辦公室裡幾個年輕人擠在一起,每個人守著一張滿是玩具的辦公桌。
這裡是北京賽博創力科技有限公司,一家AI潮玩企業,也是一家初創並不久的中小企業。其創始人、首席執行官周羿旭告訴記者,公司隻有9個人,其中7個是00后,大多是技術人員。這位95后笑稱,自己是“整個團隊裡最老的”。
對於這個年輕的團隊來說,手辦、潮玩伴隨他們長大。如今,在AI時代來臨后,他們希望借助新技術,讓這些玩具成為更鮮活的陪伴。
巴掌大的底座上,周羿旭放上一個來自三星堆的青銅人面像文創。一放到底座上,它似乎就“活”了,開口說起話來,對於記者提的問題也都對答如流,仿佛它生來就該這麼說話。
將一隻“哆啦A夢”裡的大雄手辦放上去后,它開始用日語打招呼,本報記者提醒它說中文,立刻切換成了中文對話。此刻它的說話語氣和風格,與印象中的大雄毫無二致。
這些“對話”,對人來說近乎本能,但對AI來說,要實現對話的流暢自然,需要攻克語境理解、多輪對話、知識圖譜、實時響應等諸多難題。從“傾聽”到說出符合角色的話,都需要大量技術支持。
更為難得的是,就在這個巴掌大小的底座上,已經可以支持3000多個不同角色玩偶對話,支持50多種語言對話。只要有這款底座,再配上特制的角色貼紙,玩偶、擺件、手辦等都“活”了,隨時可以成為相關愛好者的“聊天搭子”。
事實上,最近一段時間以來,AI玩具日趨火爆。不少行業觀察者認為,AI玩具兼具教育與陪伴屬性,是具有真實需求的AI硬件落地方向。在這個領域,盡管只是中小企業,但賽博創力已經引起了不少人關注。就在過去兩個月中,他們的產品先后亮相巴塞羅那、東京等地的重要展會。
這些逼真的玩具,既誕生於這10平方米的辦公室,也有來自遠方的支持。
從去年六七月份開始,賽博創力就選擇了阿裡通義大模型和阿裡雲的雲計算服務器。合作過程中,在通義千問大模型的基礎上進行了諸多優化。周羿旭說,在這個過程中,來自阿裡雲的技術人員會幫助解決底層問題,然后再根據實際需求修改。
雙方溝通非常頻繁,也有著明確的分工。周羿旭說,阿裡有五六個不同的技術團隊在與賽博創力對接,既包括產品側也包括技術側,解決語音服務、大模型訓練等諸多工作。“我們團隊的工作是探索更好玩的應用場景,大模型的基礎能力則依賴阿裡,將它們視作水和電一樣的基礎設施。”
大模型支撐著諸多新玩法。比如,在賽博創力的APP上有一個功能,用戶可以用手機拍一張照片上傳,APP自動一鍵創建一個全新角色。在生成角色過程中需要完成的識別角色、定義性格等,都是大模型輔助用戶去完成的。
技術的不斷發展,也為AI玩具提供著越來越多的想象力,更多AI玩具正在雙方合作之下迅速開發。比如AI照相機,既可以拍照,也可以對話。周羿旭舉了個例子,小朋友可以拍下一個不認識的東西,詢問AI相機﹔或者,給爸爸拍張照,然后讓AI給照片加個胡子。“這個過程中,用到的不只是大語言模型,還有多模態相關的能力。”
“比起其他大模型,阿裡雲提供的是很全能、很完整的服務。對於我們來說,通義千問最先進的技術或者更新,我們都想去嘗試,隻為能讓玩具更好玩。”周羿旭說。
創業之路上,這個年輕的團隊飛快前進。今年4月,他們完成了“賽博大舞台”底座的量產,開始啟動試銷售。來自韓國、日本、印度等幾個國家的合作客戶,也正在積極推動產品海外落地。
在AI時代“觀星”
北京大屯路,奧林匹克公園西側不遠處,是中國科學院國家天文台。朴素的建筑裡,承載著諸多重大任務。牆上,挂著“中國天眼”FAST的照片,FAST運行和發展中心就在這裡。
作為綜合性國家天文研究機構,國家天文台一直走在技術探索與革新的前沿。如今,人工智能技術在現代天文學中正在發揮越來越重要的作用。
中國科學院大學天文與空間科學學院博士生、天文大模型“星語”項目組核心技術成員李瑀旸告訴記者,對於國家天文台的多項科學職能,AI都有很好的促進作用。
比如,在位於河北承德的國家天文台興隆觀測站,一名科學家的常規工作節奏可能是這樣——早上9時到12時觀測選源、晚上六時左右開始觀測並進行數據預處理,直到早上5時,一夜下來精疲力盡。如今,人工智能可以上午整合信息布置好任務,在不同時間節點調用工具完成相關流程。這背后,是天文大模型成功接入的近鄰星系巡天項目,可實現自主控制望遠鏡進行觀測、分析觀測結果,並給出下一步觀測建議。
再如,天文力量的調配。過去,由於天氣因素影響、軟硬件協議不同、台址所處時區等各種原因,天文望遠鏡存在“各自為戰”的情況。而正在開發的基於多智能體觀測組網,多望遠鏡的協同觀測能夠有可期的進步。
李瑀旸說,這種方式最開始是從愛好者級別的天文望遠鏡開始,今年逐步提升到中型望遠鏡,最后期望運用於更高級別的科學望遠鏡。
如今,AI支持的望遠鏡協同觀測方式正在走向世界。今年4月,在“人工智能賦能的天文學開放科學會議”上,國家天文台台長劉繼峰介紹了全球開放瞬變望遠鏡陣列(GOTTA)。這一陣列計劃構建覆蓋全球的百余台1米級廣角光學望遠鏡網絡,通過小時級高頻巡天監測,捕捉超新星、伽馬暴等極端宇宙現象的早期信號,揭示強引力場下的時空本質與宇宙演化規律。
自2016年以來,國家天文台和阿裡雲就已開始長期戰略合作,雙方共同開展跨領域的研究和應用合作,用計算賦能天文研究。人工智能時代的天文學,作為海量數據學科,提供了AI應用和驅動科學發現的最佳場景之一。
雙方在大模型方面的合作,一個重要節點是在2023年12月,阿裡通義千問720億參數大模型Qwen-72B宣布開源之際。在這一模型的基礎上,國家天文台成功打造了天文知識能力最強的大語言模型。
在李瑀旸看來,大模型開源能夠讓科學家能夠更專注於模型的應用,而不是花精力在模型訓練上。“從假設生成,到基於科學儀器或軟件的實驗,再到數據處理分析、產生新的假設,整個科研過程,大模型貫穿始終。”
前不久,國家天文台接入通義千問開源模型QwQ-32B。李瑀旸說,新模型核心價值在於模擬人類專家的復雜推理過程,不僅提升了輸出內容的質量,還使科研人員能夠直觀理解模型的思考路徑,從而評估結論的可靠性。
比如,接入QwQ-32B后的天文觀測助手“星語”,在望遠鏡觀測系統中可實現對觀測目標的自動排序、望遠鏡調度和生成數據報告,將觀測中的人工干預減少了90%。
還有科教應用。在漫長的發展歷史中,國家天文台積累了大量專家與各省市師生交互的記錄,這些高質量信息用於大模型訓練,產生了非常優秀的垂直領域大模型。如今,在通義千問全新模型幫助下,在天文科教平台上新增了多項功能,例如多智能體的跨學科圓桌等項目,旨在為20萬所中小學和廣大天文愛好者提供豐富的科教內容。
在AI支持下,“觀星”這件事正在呈現出全新的可能。

分享讓更多人看到
推薦閱讀
- 護航黃河流域生態保護和高質量發展 水行政執法與檢察公益訴訟協作持續推進
- 人民網北京4月28日電 (歐陽易佳)據水利部消息,2025年,水利部將繼續聯合最高人民檢察院開展為期一年的黃河流域水生態保護專項行動,進一步加大執法力度,以“天空地水工”感知體系和中央巡視、審計、環保督察以及人大代表、政協委員、媒體、社會監督等發現的涉水違法問題為重點,對水資源管理、河湖庫管理保護、水土保持監管等領域問題進行集中整治,打好黃河保護治理攻堅戰,推動黃河保護法等法律法規落地見效,更好服務黃河流域生態保護和高質量發展。 據悉,水利部與最高人民檢察院自2022年共同建立水行政執法與檢察公益訴訟協作機制以來,已經組織開展3項專項執法活動,成效顯著。…
- 評論
- 關注