智譜AI推出第三代基座大模型 可在手機上部署

在10月27日舉行的2023中國計算機大會(CNCC)上,北京人工智能新晉獨角獸、清華大學計算機系技術成果轉化企業智譜AI推出了全自研的第三代基座大模型ChatGLM3,繼此前推出千億基座的對話模型ChatGLM和ChatGLM2之后再次實現突破。評測顯示,在44個中英文公開數據集測試中,ChatGLM3在國內同尺寸模型中排名首位。
ChatGLM3語義能力與邏輯能力得到了大幅度增強,並實現了若干新功能的迭代升級,包括多模態大模型CogVLM的看圖識語義功能,在10余個國際標准圖文評測數據集上取得SOTA(State of the art,意為“最先進的”)﹔代碼增強模塊Code Interpreter可以根據用戶需求生成代碼並執行,自動完成數據分析、文件處理等復雜任務﹔網絡搜索增強模型WebGLM接入了搜索增強能力,可以自動根據問題在互聯網上查找相關資料並在回答時提供參考相關文獻或文章鏈接。
ChatGLM3還集成了自研的AgentTuning技術,在智能規劃和執行方面相比於上一代ChatGLM2提升了1000%,並開啟了國產大模型原生支持工具調用、代碼執行、游戲、數據庫操作、知識圖譜搜索與推理、操作系統等復雜場景。以代碼功能為例,它既可以讓代碼“小白”也具備技術能力、為女友寫一段能呈現愛心圖樣的代碼,也可以成為程序員的幫手,讓它幫助生成或測試一段代碼。
此外,ChatGLM3此次還推出了可在手機上部署的端測模型ChatGLM3-1.5B和ChatGLM3-3B,支持包括vivo、小米、三星在內的多款手機以及車載平台,甚至支持移動平台上CPU芯片的推理,速度可達20tokens每秒(token是語言模型中用來表示單詞或短語的符號)。
近日來,國際人工智能芯片斷供對國內人工智能大模型公司的影響備受關注。智譜AI CEO張鵬介紹,自2022年初其推出的GLM系列模型已支持在昇騰、神威超算、海光DCU架構上進行大規模預訓練和推理。截至目前,智譜AI的產品已支持10余種國產硬件生態,包括昇騰、神威超算、海光DCU、海飛科、沐曦曦雲、算能科技、天數智芯、寒武紀、摩爾線程、百度昆侖芯、靈汐科技、長城超雲等。他表示,公司將通過與國產芯片企業的聯合創新不斷優化性能,助力國產原生大模型與國產芯片早日登上國際舞台。

分享讓更多人看到
- 評論
- 關注