“十五五”加強高水平數據科技創新系列解讀三
加強數據科技關鍵技術研發 支撐我國數據事業可持續發展
222
點擊播報本文,約
數據科技是釋放數據要素價值、驅動新質生產力的核心支撐。“十五五”規劃建議提出,加快高水平科技自立自強,引領發展新質生產力。近期,國家數據局發布《關於加強數據科技創新的實施意見》,進一步為數據科技創新劃定了“路線圖”與“施工圖”,標志著我國數據科技發展進入體系化布局、協同化推進的新階段。多位專家將深入解讀數據科技前沿趨勢、技術突破路徑與產業融合實踐。
近日,國家數據局發布《關於加強數據科技創新的實施意見》(以下簡稱《實施意見》),對數據科技的技術攻關和高水平應用等提出了具體的要求。《實施意見》明確定義,數據科技是以發揮數據疊加倍增作用、釋放數據要素價值為目標,系統性構建的數據科學、技術與工程體系。
從這個定義可以看出,數據科技是一個具有鮮明中國特色的新科技概念。其特色主要體現在三個方面:一是體現在目標導向上。數據科技旨在推動數據在社會經濟發展中的深度融合與應用,充分釋放數據作為新型生產要素的價值,服務於國家數字經濟發展與數字化轉型的戰略需求﹔二是體現在體系架構上。數據科技並非單一技術,而是涵蓋數據供給、流通、利用和安全等關鍵環節的技術體系。這種面向應用場景的分類方式,更有助於理解數據科技對數據產業全鏈條的支撐作用﹔三是體現在發展需求上。數據科技與現有大數據技術密切相關,同時又對其提出了新的系統性要求。為適應數據要素市場化配置與價值釋放的需要,迫切需要對現有大數據技術體系進行重構與升級。
國家數據局成立以來,通過一系列政策文件與實際行動,有力推動了數據要素市場的培育與發展。然而,數據資源要真正轉化為現實生產力,除了制度保障之外,也離不開數據科技的有力支撐。相關文件的出台與數據科技的進步,必將對我國數據要素市場建設與數字中國進程產生深遠影響。
厘清數據科技發展的底層技術邏輯
數據科技是面向數據要素價值化這一目的而構建的數據供給、流通、利用和安全等技術,除了少數特定技術外,其多數技術能力根植於大數據、人工智能、信息安全等基礎信息技術之中。
具體可從數據價值實現過程來理解二者的關系: 一是讓數據“供得出”,核心在於數據匯聚與集成。需要破解數據孤島問題,從各類異構信息系統中低成本、高可靠地提取、重組與匯聚數據,並實現數據的長期保存與就緒可用。數據需要在支持業務功能實現的同時,在源頭就實現數據要素化﹔二是讓數據“流得動”,核心在於跨域數據管理與協同。為促進數據在不同主體間的安全有序流動,需對數據流通過程進行訪問控制、全程留痕、可信審計,並支持跨域的數據查詢、處理分析,這對數據管理、處理和治理技術都提出了更高要求﹔三是讓數據“用得好”,核心在於多模態大數據分析與大模型訓練。當前數據分析技術已形成從傳統關聯分析、機器學習到深度學習、神經網絡乃至大模型驅動的廣譜分析體系,正朝著更深度的語義理解與更精准的決策支持演進。大模型訓練需要大量的高質量的數據集,這也是使用數據的重要形態﹔四是讓數據“保安全”,核心在於數據治理與安全合規。這涉及數據全生命周期的權限控制、加密保護、隱私計算、合規審計等技術。與傳統的信息安全技術側重點有所不同,必須從支撐數據流通與價值釋放的視角,體系化構建兼顧安全與利用的數據流通安全治理方案。
由此可見,數據科技與基礎信息技術,尤其是大數據技術和信息安全技術,緊密相關且深度融合。數據科技的進步,在很大程度上依賴於大數據等相關基礎技術的持續突破與適配演進。
構建數據科技發展的“以數據為中心”大數據技術體系
《實施意見》在總體要求中明確了數據科技關鍵技術的發展目標,到2027年要在數據供給、流通、利用和安全等關鍵技術和設備實現階段性突破,到2030年數據領域關鍵技術達到國際領先水平。這一目標艱巨而光榮,是我國數據科技工作者的歷史使命與發展機遇。為了實現這一目標,《實施意見》從基礎研究、技術攻關、概念驗証、成果轉化等技術發展的全鏈條進行了系統部署。
一是要加強基礎研究和應用基礎研究。數據要素化要求我們應該從數字孿生視角去看待數據的組織模式,以物理世界和人類社會的“對象”為核心進行組織與匯聚。傳統信息系統以業務流程為中心組織數據,優化目標是提高系統的處理效率﹔未來則應推動數據與應用系統解耦,以數據價值釋放為最終優化目標,構建獨立於具體應用系統的數據資源體系。數據的價值來源於數據的“流動”,沒有數據之間的匯聚、融合、分析,就不可能產生新的價值。數據的價值如何度量?數據流動的背后的規律是什麼?需要什麼樣的數據流通基礎設施?這些問題都值得深入去研究。國家數據局聯合國家自然科學基金委員會曾發布數據要素專題項目來支持數據科技的基礎研究,相信未來還會有更多的基礎研究類項目支持數據科技領域的前沿問題研究。
二是要加強關鍵數據技術的攻關突破。用“以數據為中心”的學術思想,重構大數據技術體系,是攻關突破的方向。以數據為中心就是要以數據的高效可信的供給、流通和利用為中心,“跨域”是其中最為核心的挑戰與主戰場。這裡的“跨域”具有多重含義,至少包括跨空間域、跨管轄域、跨信任域等,根源在於數據需要在不同主體間高效地共享流動,還要構建可信的環境,保障數據的權屬和數據的安全。因此,未來大數據技術(管理、處理、分析、治理)必須將“跨域協同能力”作為設計的核心考量。當然,“以數據為中心”的內涵還需要我們在數據科技的持續技術攻關中不斷深化。國家數據局之前曾對數據流通基礎設施提出了多種可能的解決方案,包括可信數據空間、數聯網等,數據科技的關鍵技術攻關需要針對這些數據流通基礎設施形成可行的大數據技術的集成方案。
三是以場景推動數據技術的落地,形成新質生產力。國際領先水平需要體現在對新興產業的支撐上,體現在賦能社會經濟高質量發展裡,體現在大國博弈的科技自立自強中。《實施意見》對科技成果轉化進行了全鏈條布局,明確提出了要布局建設一批數據領域的概念驗証、中試基地、檢驗檢測等平台,通過“高價值、廣覆蓋、強牽引”的數據科技應用場景,為技術驗証提供“試驗田”。這正是我們科技創新的舉國體制的優勢所在。
國家數據局印發《實施意見》,明確提出加強數據科技創新,將極大地推動“十五五”時期我國數據事業的發展。我們應牢牢把握這一機遇,推動“以數據為中心”的大數據技術體系重構,力爭在由中國引領的數據科技發展道路上取得突破、發揮關鍵作用。(作者杜小勇系中國人民大學教授)
(人民網記者許維娜 整理)
【相關閱讀】
關注公眾號:人民網財經
分享讓更多人看到
- 評論
- 關注































微信掃一掃


第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量