人工“護航”算法 保障內容平台生態安全

“推薦算法本質上是一套高效的信息過濾系統。在實際應用中,平台推薦系統採取‘人工+機器’協同的方式進行風險治理,始終有人工運營和治理體系為算法導航。”4月15日,抖音生態運營經理陳丹丹在抖音“安全與信任中心開放日”活動上介紹。
算法能學習和預估用戶行為,但其對內容語義的理解存在不足,可能導致違法違規、不良內容被推薦傳播,因此,在真實使用場景中,必須通過平台治理對算法進行約束和規范。目前,抖音已建成一套完整的內容治理體系。
陳丹丹介紹,抖音的內容治理體系是採用“人工參與+機器學習”相結合的模式,而且組建了專門的平台治理團隊為算法設置“護欄”。創作者將內容上傳至抖音后,首先進入機器識別環節。如果內容被識別出含有高危特征,將被直接攔截﹔若未命中高危特征但模型判斷有問題,則會送至人工審核﹔若問題概率較低,則獲得基礎流量進入下一環節。在抖音平台治理的審核流程下,流量越高的內容經過評估的次數越多,標准也越嚴格。視頻被舉報、評論區出現集中質疑、流量激增等情況出現,均可能觸發審核。一旦內容在任一環節被處置,系統會立即停止進一步推薦和分發。
針對社會普遍關心的、對用戶造成較多困擾的焦點問題,抖音成立了多個專項治理團隊,針對詐騙、網暴、虛假擺拍、未成年人保護、網絡水軍、AIGC(人工智能生成內容)技術濫用等一系列專項風險進行治理。
以網暴風險應對為例,相關內容治理面臨概念難界定、時效難保証、單個平台難以根治等問題。為此,抖音成立了專門治理網暴的團隊,通過網暴風險特征構建模型,對識別出的潛在網暴受害者主動提醒風險,引導開啟一鍵防護功能。
“在不實信息治理方面,我們近日上線了辟謠卡,遏制不實信息的傳播。”陳丹丹以謠言治理為例稱,目前,當用戶在抖音搜索一些謠言相關的信息時,搜索結果將以“辟謠卡”頁面形式呈現,明確標注相關信息為“謠言”或“存疑”,還會為用戶提供權威媒體辟謠、當事人發聲等信息。據了解,為打造良性的辟謠生態,抖音還會對發布不實信息的用戶和易受不實信息影響的用戶,定向精准推薦辟謠視頻。
目前,在處於試運營階段的抖音安全與信任中心網站上,除了闡釋算法、治理等,還公布了平台倡導的社區價值,以及對優質內容的定義。據了解,未來,抖音將以安全與信任中心為依托,持續增加算法和治理透明度,回應社會關切的議題,主動公示違規案例治理情況,接受公眾監督。

分享讓更多人看到
- 評論
- 關注