4 月 16 日消息,據抖音集團官方公眾號,在昨日的抖音安全與信任中心開放日活動上,抖音相關業務負責人基于網站版塊,就社會關切的算法和治理問題展開介紹。
據介紹,抖音算法已幾乎不依賴對內容和用戶打標簽,而是通過神經網絡計算,預估用戶行為,計算用戶觀看這條內容獲得的價值總和,把排名靠前的內容推給用戶。
在抖音的實際應用中,推薦系統采取“人工 + 機器”協同的方式進行風險治理,始終有人工運營和治理體系為算法導航;多目標體系算法能主動打破“信息繭房”,為用戶帶來更豐富多元、實用可靠的推薦結果。
抖音應用的深度學習算法包括 Wide&Deep 模型、雙塔召回模型等。前者可解決協同過濾算法容易造成信息單一、泛化不足的問題,后者在召回環節提供更好的推薦效果。
基于人工智能機器學習和深度學習構建的推薦算法,其本質是數學模型的運算過程,只是在建立用戶行為與內容特征之間的數學統計關聯,而非理解內容本身。抖音推薦算法的核心邏輯可以簡化為“推薦優先級公式”:綜合預測用戶行為概率 × 行為價值權重 = 視頻推薦優先級。
模型需要內容和用戶兩端的數據做輸入,其中主要是學習用戶行為數據。結合用戶行為和視頻本身的價值權重,推算出視頻推薦的價值分數,并將綜合得出的價值最高的視頻推送給用戶。
官方表示,抖音的價值模型希望實現內容、用戶、作者以及平臺的多方價值共贏,并通過不斷調整參數,對各類價值進行加權。隨著算法的進步,抖音已經實現了“分鐘級”實時反饋更新。
抖音表示,推薦算法通過各種“目標”來預估用戶行為。推薦算法誕生之初,只關注單一或者少量的目標。隨著抖音的用戶愈發多樣化,內容風格也日益多元,平臺上有了越來越多的優質中長視頻,完播率等少數目標難以滿足需求,多目標建模成為技術上的自然選擇。
抖音已經發展出非常復雜的多目標體系,比如將收藏率納入多目標,幫助知識類內容推送給有需求的用戶;增強“收藏 + 復訪”“關注 + 追更”“打開 + 搜索”等組合目標,預估用戶長期行為,幫助用戶探索長期需求;設置探索類指標,幫助用戶探索可能他們自己都還沒發現的潛在需求,助力破除“信息繭房”;設置原創性目標,鼓勵優質、新穎且具有獨特價值的內容推薦。
據IT之家此前報道,3 月 30 日,“抖音安全與信任中心”網站上線。網站首次公開抖音推薦算法原理,介紹其推薦算法如何預估用戶行為概率,并通過多目標建模等方式實現更優質、豐富的內容推薦,而算法需由平臺治理體系對其進行約束和規范。