人民網
人民網>>經濟·科技

中國逐鹿人工智能,哪些關鍵技術被國外壟斷著?怎麼破?

——專訪中國工程院院士、清華大學計算機科學與技術系教授鄭緯民

2021年09月28日08:57 | 來源:中國新聞網
小字號
原標題:中國焦點面對面:中國逐鹿人工智能,哪些關鍵技術被國外壟斷著?怎麼破?

當前,新一輪科技革命深入演進,數字時代扑面而來,全球主要國家在數字經濟領域展開激烈角逐。關鍵數字技術創新,中國已經取得了哪些優勢?在當前國際環境下,面臨哪些難題要“啃”?

作為引領未來的戰略性技術——人工智能是中國提高經濟與科技水平、提升國際競爭力的重要算力基礎設施,目前各地掀起了人工智能計算中心的建設熱潮。人工智能計算中心如何才能發揮出最大價值?中國人工智能計算中心技術自主可控水平如何?哪些關鍵技術被國外壟斷著?近日,中國工程院院士、清華大學計算機科學與技術系教授鄭緯民接受“中國焦點面對面”專訪,進行權威解讀。

訪談實錄摘編如下:

給三句話,它就能寫50集連續劇

記者:近期,中國“人工智能計算中心訂單爆單”的話題引發不少關注。武漢市5月底建成的第一個人工智能計算中心,剛開張就天天客滿,滿負荷運行,目前預約已經排到半年以后。人工智能(AI)計算中心是算什麼的?為何市場需求這麼強?

鄭緯民:人工智能有多種多樣的應用場景,需求很旺。根據場景可以分為三大類應用:

一、圖像檢測、視頻檢索類。可以用在安防、醫療診斷、自動駕駛。核心是卷積網絡,這一類應用落地做得很好,已經起到了很好的作用。

二、決策類。比如交通規劃等,這個類型也已經起到了很好的效果,核心是強化學習。

三、自然語言處理類。比如搜索與推薦,智能人機接口,核心是Transformer。在應用方面,語言翻譯,把中文翻譯成英文,英文翻譯成日文等,問什麼問題都能回答,這樣的機器需要非常大才行。又比如生成文本摘要,你給它三句話,能給你寫成50集電視連續劇。

這三類應用的需求很多,所以才會(出現訂單)排隊排到半年后這樣一個情況。

記者:目前流行的人工智能計算中心與傳統數據中心有何不同?日前,工信部印發《新型數據中心發展三年行動計劃(2021-2023年)》,《行動計劃》中定義的新型數據中心和人工智能計算中心是一回事嗎?

鄭緯民:傳統數據中心主要由通用CPU架構的服務器集群構成。近年來,隨著人工智能的發展,數據中心也逐漸包括了很多具有高性能人工智能算力(GPU或人工智能加速器)的機器。

而人工智能計算中心是什麼呢?主要由具有高性能人工智能算力(GPU或人工智能加速器)的機器組成。因此可以說,數據中心概念的覆蓋面會更大一些,包含了人工智能算力。

中國技術自主可控嗎?

記者:人工智能和大數據中心都屬於“新基建”,當前全球主要國家都在大規模建設人工智能、大數據基礎設施,有人說未來人工智能算力將會像水和電一樣,成為一種公共基礎資源,對此您怎麼看?中國建設人工智能基礎設施有哪些核心優勢?中國人工智能計算中心的技術自主可控水平如何?哪些關鍵技術被國外壟斷著?

鄭緯民:從全球公有雲市場的快速發展可以看出,通用算力和人工智能算力都是公共基礎設施,是一種重要的趨勢,過去通用的算力是基礎設施,現在把人工智能算力也作為基礎設施,正在被越來越多的用戶認可。

但是我們也要注意到,算力作為基礎設施,需要相關的數據作為基礎,把機器包括普通的機器,包括人工智能的機器都放在雲上,不少行業的數據隱私性和保密性,對其上雲仍然有很大的限制,怎麼把數據放在雲上是一個值得考慮的問題。

中國在建設人工智能基礎設施上的主要優勢,是政府主導的投入較多。但在市場化建設和運營,整體人工智能算力基礎軟硬件的技術水平和自主可控程度上,還與美國有一定的差距,如,編程框架目前以TensorFlow和Pytorch為主。智能計算芯片方面,華為昇騰和寒武紀在人工智能算力體系結構上取得了很好的進展,但受制於先進芯片制程,或在軟件生態環境上仍然與Nvidia產品有明顯差距,仍然需要盡快發展。

記者:“人工智能計算中心訂單爆單”話題之外,近期鵬城實驗室大科學裝置“鵬城雲腦II”接連斬獲多項國際獎項,也受到業界關注。作為“新基建”,它們可以為科研創新項目提供哪些強大支持?在賦能行業應用等方面有哪些價值?

鄭緯民:在科研創新方面,目前一個非常重要的趨勢是HPC(高性能計算)+AI(人工智能),就是把傳統基於模擬方法的高性能計算應用與AI模型結合起來。解決過去解決不了的問題,或是把過去耗時很長的問題加速成千上萬倍。

這方面,AlphaFold(DeepMind人工智能系統)給出了非常好的例子,用人工智能方法來協助進行蛋白質結構預測,解決了過去使用純科學計算模擬方法由於計算量過大無法解決的問題。HPC和AI結合是我們創新的一個非常明顯的優勢。

在賦能行業方面,鵬城實驗室可以為智慧城市提供強大的人工智能算力,承載智慧城市應用中的智能交通、智能公共衛生等功能,鵬城雲腦II也在開展“一帶一路”語言的自動翻譯,為“一帶一路”(倡議)提供重要支持。

大模型方面,目前主要在自然語言處理效果方面取得了比較大的進展,但具體應用領域還在探索之中。

記者:各界都認為依靠人工智能實現智能轉型是必修課,但目前中國產業主體存在著發展著力點分散等問題,從這個角度來看,政府統籌建設大規模的人工智能基礎設施是否是一個比較好的解決企業轉型的路徑?大規模、集約型基礎設施有哪些獨特優勢?

鄭緯民:目前,各地政府在建設人工智能基礎設施上有很大的積極性,對本地產業的人工智能賦能,應該說能夠起到很好的推動作用。但也要注意,要因地制宜地分析本地產業人工智能化的路徑和節奏。

大規模、集約型基礎設施,主要是在完成超大規模模型的訓練方面起到關鍵作用。目前看大模型確實是重要的發展趨勢,但人工智能算法的規模大小是否有局限性仍是一個開放的問題。

各地為何掀人工智能計算中心建設潮?

記者:當前國內掀起了人工智能計算中心建設熱潮,有20多個城市在規劃建設人工智能計算中心,目前中國人工智能計算中心運營和落地情況如何?

鄭緯民:從武漢和鵬城雲腦的經驗看,目前的人工智能計算中心運行情況還是很好的,需要機時的用戶很多,需要排很長時間的隊才能用到機器,這也體現出國內用戶對於人工智能算力的強勁需求。

所以我覺得,建設一個人工智能計算中心為當地的企業、研究單位、高等院校等進行創新賦能,都是會起到很大作用。

記者:作為各方資源極度聚合的龐大基礎設施,人工智能計算中心建設之后的運營同樣是一大命題,在這點上您有什麼建議?如何科學運營才能讓各地人工智能計算中心發揮出最大價值?人工智能計算中心有哪些運營評估維度?

鄭緯民:我覺得特別要注重數據治理。算力提供了,數據該怎麼提供?

隨著《個人信息保護法》的出台,對數據的使用增加了很多合規性要求,作為地方政府主導建設的人工智能計算中心,除了算力以外,是否能夠提供重要價值的相關的數據。如何在既遵守《個人信息保護法》,又能夠讓智能算法獲得所需要的數據是人工智能計算中心運營中的一大課題。

再有就是運營要注意財務上的可持續性,一定要收費運行。避免用戶無償大量使用資源,這樣看起來利用率很高,但很可能算的東西沒有價值。對特殊的需要賦能支持的用戶,可以採用發放機時券的方式來支持。這方面,過去不少超算中心,比如廣州超算、無錫超算已經有很成熟的體系,可以借用。

人工智能計算中心的運營評估可以包括利用率、投資回報率、功耗以及應用效果等。其中,利用率我想多說一點,並不是100%的利用率是最好的,因為利用率越高,意味著作業排隊時間越長,因此一般來說60%-70%左右的利用率就是個很好的平衡了,不必追求接近100%的利用率。

記者:結合數字經濟和產業發展趨勢,您認為未來人工智能計算中心的發展方向如何,會不會在一段時期的建設爆發后又迅速轉入冷淡期?

鄭緯民:人工智能與產業的結合剛剛開始,我對人工智能在各行各業的應用擴展還是充滿信心的,我認為人工智能計算中心還是有很大的發展空間。對我們科研的創新,對企業的賦能,對人民生活的改善都會有很大的好處。

中國有能力“從頭先進”

記者:中國“十四五”規劃和2035年遠景目標綱要提出,加強關鍵數字技術創新應用,加快推進基礎理論、基礎算法等研發突破與迭代應用。關鍵數字技術創新,中國已經取得了哪些優勢?在當前國際環境下,面臨哪些難題要“啃”?哪些與人工智能計算中心密切相關?預計未來發展趨勢如何?

鄭緯民:中國在基礎理論和算法上還很難談優勢,但是基本上可以跟隨第一梯隊,就是美國人提出來的算法和理論,我們很快能夠跟上並加以改進應用。

整個數字技術中,除了硬件的芯片制造產業鏈,我想特別強調,中國在基礎軟件方向還是有很多的課要補。我們現在大量的軟件,包括操作系統、數據庫、編譯器、人工智能編程框架等,不是自己從頭構建的,而是在開源基礎上修改的。

應該說,能夠在開源軟件基礎上進行大量修改,已經証明我們取得了很大的進步,對我國數字技術的自主化具有重大意義。但是我們如果對自己提出更高的要求,就必須擁有自主從頭構建先進的基礎軟件的能力。

這裡的“先進”是指,我們構建的新軟件要比現有的軟件在性能和功能方面有代差的優勢。這方面產業界,華為的鴻蒙操作系統、人工智能編程框架MindSpore等給出了很好的范例。我們學術界,清華大學的時序數據庫、圖計算系統、儲存系統也取得了一定的進展,我們期待國內的產業界和高校能夠更加重視從頭構建先進的基礎軟件,為中國和世界的數字產業界提供更多革命性的基礎系統軟件。因此,我特別強調“從頭先進”這四個字,“從頭”就是我們從頭做,“先進”就是比現有的軟件好10倍20倍,我們有這個能力,希望通過這個辦法,來改善我們國家IT行業的現狀。

(責編:曹淼、李源)

分享讓更多人看到

返回頂部