人工“護航”算法保障內容平台生態安全

楊雪

2025年04月17日08:36 | 來源：科技日報

小字號

原標題：人工“護航”算法保障內容平台生態安全

“推薦算法本質上是一套高效的信息過濾系統。在實際應用中，平台推薦系統採取‘人工+機器’協同的方式進行風險治理，始終有人工運營和治理體系為算法導航。”4月15日，抖音生態運營經理陳丹丹在抖音“安全與信任中心開放日”活動上介紹。

算法能學習和預估用戶行為，但其對內容語義的理解存在不足，可能導致違法違規、不良內容被推薦傳播，因此，在真實使用場景中，必須通過平台治理對算法進行約束和規范。目前，抖音已建成一套完整的內容治理體系。

陳丹丹介紹，抖音的內容治理體系是採用“人工參與+機器學習”相結合的模式，而且組建了專門的平台治理團隊為算法設置“護欄”。創作者將內容上傳至抖音后，首先進入機器識別環節。如果內容被識別出含有高危特征，將被直接攔截﹔若未命中高危特征但模型判斷有問題，則會送至人工審核﹔若問題概率較低，則獲得基礎流量進入下一環節。在抖音平台治理的審核流程下，流量越高的內容經過評估的次數越多，標准也越嚴格。視頻被舉報、評論區出現集中質疑、流量激增等情況出現，均可能觸發審核。一旦內容在任一環節被處置，系統會立即停止進一步推薦和分發。

針對社會普遍關心的、對用戶造成較多困擾的焦點問題，抖音成立了多個專項治理團隊，針對詐騙、網暴、虛假擺拍、未成年人保護、網絡水軍、AIGC（人工智能生成內容）技術濫用等一系列專項風險進行治理。

以網暴風險應對為例，相關內容治理面臨概念難界定、時效難保証、單個平台難以根治等問題。為此，抖音成立了專門治理網暴的團隊，通過網暴風險特征構建模型，對識別出的潛在網暴受害者主動提醒風險，引導開啟一鍵防護功能。

“在不實信息治理方面，我們近日上線了辟謠卡，遏制不實信息的傳播。”陳丹丹以謠言治理為例稱，目前，當用戶在抖音搜索一些謠言相關的信息時，搜索結果將以“辟謠卡”頁面形式呈現，明確標注相關信息為“謠言”或“存疑”，還會為用戶提供權威媒體辟謠、當事人發聲等信息。據了解，為打造良性的辟謠生態，抖音還會對發布不實信息的用戶和易受不實信息影響的用戶，定向精准推薦辟謠視頻。

目前，在處於試運營階段的抖音安全與信任中心網站上，除了闡釋算法、治理等，還公布了平台倡導的社區價值，以及對優質內容的定義。據了解，未來，抖音將以安全與信任中心為依托，持續增加算法和治理透明度，回應社會關切的議題，主動公示違規案例治理情況，接受公眾監督。

(責編：楊曦、陳鍵)

關注公眾號：人民網財經