人民網
人民網>>經濟·科技

阿裡雲通義開源多模態推理模型QVQ在多領域表現突出

2024年12月26日09:52 | 來源:環球網
小字號

原標題:阿裡雲通義開源首個多模態推理模型QVQ 在數學、物理等領域表現突出

 12月25日,阿裡雲通義千問發布開源多模態推理模型QVQ-72B-Preview。據了解,QVQ的優勢在視覺理解和推理能力,在解決數學、物理、科學等領域的復雜推理問題上表現尤為突出。目前,開發者可在魔搭社區和HuggingFace平台上直接體驗。

據了解,QVQ是一個會基於視覺進行深度思考推理的大模型。QVQ不但能感知更准確的視覺內容,並據此作出更細致的分析推理,還會質疑自身假設,仔細審視其推理過程的每一步,經過深思熟慮后給出最后結論。QVQ可以輕鬆識別“梗圖”內涵﹔看真實照片可合理推斷出物體個數及高度等信息﹔在面對數學、物理、化學等各科學領域難題,QVQ能像人甚至科學家一樣,給出思考過程和准確答案。

目前,QVQ-72B-Preview已在魔搭社區和HuggingFace等平台上開源,開發者可上手體驗。截至目前,通義千問Qwen的衍生模型數突破7.8萬個。

(責編:曹淼、李源)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
返回頂部