DeepSeek進入“國家隊”:
加速國產AI技術生態發展與普及
![](/img/2020wbc/imgs/icon_type.png)
近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入國家超算互聯網平台。據介紹,DeepSeek-R1專注於自然語言處理,具備強大的文本生成能力﹔DeepSeek-V3聚焦於圖像生成,能夠生成高分辨率和細節豐富的圖像,適用於廣告、藝術創作等多個場景﹔DeepSeek-Coder是一款代碼生成模型,能夠協助開發者快速構建程序,提高開發效率。
超算互聯網是以互聯網思維運營超算中心,並連接產業生態中的算力供給、應用開發、運營服務、用戶等各方能力和資源,構建一體化超算算力網絡和服務平台。其目標是緊密連接供需雙方,通過市場化的運營和服務體系,實現算力資源統籌調度,降低超算應用門檻,並帶動計算技術向更高水平發展,推動自主核心軟硬件技術深度應用,輻射帶動自主可控產業生態的發展與成熟。
為促進超算算力一體化運營、打造國家算力底座,國家超算互聯網平台去年4月正式上線,覆蓋科學計算、工業仿真、人工智能(AI)模型訓練等各個領域。
記者從國家超算互聯網平台了解到,截至今年1月,平台上已有各類算力商品超6500款,其中模型服務近240款,既有DeepSeek、Qwen等國內開源大模型,也有Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等國外開源模型。
對於DeepSeek的上線,國家超算互聯網平台相關負責人表示,先進的國產AI技術與國家級綜合算力服務平台融合,是加速國產AI技術生態發展與普及的前沿實踐,其將在市場、技術、創新、產品及用戶方面推動AI技術生態創新及成果落地,促進AI+的多樣化,推動中國乃至全球AI市場的應用落地和產業化進程。通過國家超算互聯網平台,用戶無需本地下載,可在線部署、推理、定制化訓練與開發DeepSeek等國內外知名開源大模型,降低了AI技術使用門檻。與此同時,算力服務的普惠性也得到提升,國家超算互聯網平台依托國產深算智能加速卡與全國一體化算力服務體系,為DeepSeek等模型提供豐富的異構算力資源,為國產AI應用與創新提供持續算力保障。
DeepSeek系列模型在性能上與世界頂尖的大模型不相上下,但在成本上卻具有顯著優勢。DeepSeek系列通過算法優化顯著降低計算資源消耗,結合國家超算互聯網平台“普惠易用、豐富好用”的能力,使得更多企業和用戶能夠負擔得起AI技術的應用,加速AI技術普及。
業界普遍認為,DeepSeek模型在超算互聯網平台的規模化落地,或將改變國內AI行業依賴海外閉源模型的現狀。
![關注公眾號:人民網財經](/NMediaFile/2022/0801/MAIN202208010936066173860781061.jpg)
分享讓更多人看到
熱門排行
![微信掃一掃
提供新聞線索](/NMediaFile/2022/0801/MAIN202208010935511458538308755.jpg)
提供新聞線索
- 評論
- 關注