李兵:“白澤”跨模態大模型高效賦能數字版權保護
人民網北京6月30日電 (王紹紹)28日下午,2023中國新產業(北京)峰會在人民網一號演播廳舉行,本屆峰會以“智能新時代、產業新未來”為主題,邀請多位頭部企業與專精特新企業代表、專家學者齊聚一堂,共同探討智能元年,科技與產業的融合共生,探討賦能中小企業發展的新路徑、新場景。
人民中科首席科學家李兵。人民網 王紹紹攝
機器輔助內容的生成、傳播、聚合,給數字內容及其版權的智能化運營帶來新機會、新模式的同時,也給版權保護帶來了全新的挑戰。人民中科首席科學家李兵介紹,基於“白澤”跨模態大模型,用戶可高效率、低成本的智能化掃描、識別和分析互聯網上的海量多模態數字內容,判斷內容被使用和傳播的情況。
李兵表示,隨著技術的進步,內容呈現方式日趨視頻化、互動化,內容形態已經從傳統的文本、圖片發展到以音視頻為主的多模態。自動化工具的普及,使制作變得更加大眾化、個人化的同時,使用和傳播別人的內容也變得十分容易和方便,尤其是最近幾年出現了基於生成式人工智能(AIGC)的全自動方法,效率遠超以往的手工編輯或基於編輯軟件的半自動方式。
李兵介紹,“白澤”是海量多源異構跨模態數據預訓練的基礎模型,並使用了先進的跨模態智能理解技術,能夠對文本、圖像、視頻等多種模態信息進行統一理解、統一表達、統一度量,從而實現跨模態生成、跨模態搜索、開集視頻標簽、跨模態對話、細粒度跨模態搜索等功能。“白澤”數字版權保護平台正是基於“白澤”跨模態大模型強大的內容理解與發現能力,能夠實現一站式智能化的版權運營與監測,具有以下特點:
服務功能全:平台實現了從版權管理、內容監測、固証取証、統計分析的一站式服務。隻需提交目標內容,平台便自動進行監測,發現線索后可自動審核、自動取証,有效解決了線索發現難、手動取証時間長、人力成本高等問題。
監測范圍廣:平台實現了跨平台的內容掃描,覆蓋數十家主流平台,實現從實時、三個月、半年、一年到更長時間內發布內容的監測。
監測手段多:平台除了支持文本、圖像、視頻單模態內容輸入,還支持多種模態、多種線索內容同時輸入,並支持多線索邏輯運算操作,充分利用跨模態理解和協同能力,發現數字內容、數字商品中的違規、偽造、雷同等信息。
監測精度高:平台能夠實現文件級、片段級、秒級以及幀級的目標內容精准發現。從而實現快速精准取証。
抗攻擊型強:數字內容及其版權的監測需要適應長期的博弈對抗,平台適應大面積裁剪、背景填充、屏幕翻拍、人臉變換、畫中畫、重編碼、馬賽克等多達20多種的常用手段,實現對抗環境下的目標內容發現。
監測速度快:平台採用了自主研發的基於“教導主任-教師-學生”的模型蒸餾與加速算法,能夠實現在億級規模上的秒級響應,從而實現對大規模復雜數據的快速監測能力。
監測數據豐富:平台能夠提供版權違規內容,違規賬號,違規賬號屬性以及關系、違規態勢等多維度的監測信息,為探索版權運營提供了新模式和新的機制,也為未來相關數字版權標准定制和實施提供了非常重要的支撐依據。
“下一步,‘白澤’數字版權保護平台將繼續完善版權登記和聚集、版權監測和保護、版權交易和資產化、版權運營和傳播等核心模塊,為數字內容的優質發展提供可信的人工智能技術。”李兵說。
分享讓更多人看到
- 評論
- 關注