抖音算法突破,教你快速上抖音熱門推薦
在抖音推薦系統的實踐中,我們經常遇到各種問題。
1.建議重復
在內容制作持續下降和產量不斷增加的背景下,當新聞事件發生時,權威新聞來源將發布新聞公告。由于媒體將從不同角度發表評論,搬運工也將批量生產熱門內容。
內容的繁榮也帶來了信息的過載。對于用戶而言,他們需要的是有價值的信息而不是相同的內容。用戶可能在抖音頁面上討厭相同的今日頭條,當他們點擊今日頭條并發現內容不是新內容時,他們將開始粉碎和拍攝。
抖音重復是內容推薦必須解決的問題。
結合用戶的使用過程,我們將用戶對內容的消費分解為抖音頁面消費和詳細頁面消費。前者與點擊之前的消費者預判相關(如圖1左側所示),而后者表示用戶點擊后的消費者體驗(如圖1右側所示)。
我們列出了頁面消耗和詳細頁面消耗
基于這兩個維度,我們可以得到一個2×2表,如下表所示。
這四種場景對應于內容重復的四種處理方法:
案例A(A和B,抖音頁面和詳細信息頁面是相同的):從消費的角度來看,A和B的兩個內容是用戶的替代。
在用戶消費A的內容之后,很有可能不消耗B的內容。然后,對于推薦系統,需要從A和B的兩個內容中進行選擇,并選擇應該向用戶顯示的內容。因此,問題從內容選擇轉移到信息源選擇,并且有必要深入研究重復組成的原因和內容的消費特征。
由載體編號原始內容的抄襲:顯示原始內容并懲罰承運人。
媒體機構發布的新聞稿:選擇首次,高度權威的媒體,或根據用戶的訂閱關系推薦用戶訂閱的自媒體。
熱點轉發內容:在此方案中,“轉發的人”具有一定數量的信息。我們將根據用戶與貨運代理的關系是否接近來判斷是否需要顯示。如果密封性低,則不會顯示。
對于具有重復消費屬性的一些內容,例如音樂,講故事,串擾等,可以通過產品設計方法(例如歷史,再看,收藏抖音,廣播順序等)重復相同的內容。
案例B(A和B,抖音頁面不同但詳細信息頁面相同):在重新打印的情況下,抖音頁面中顯示的文章具有不同的“構成”。需要進一步分析以確定用戶是否已看到內容。
如果用戶點擊A的內容,則需要推薦B內容并不是很大,因為從點擊后的消費者體驗來看,用戶并沒有獲得額外的收入。如果用戶沒有點擊A的內容,則B的內容與發布者的抖音,今日頭條和封面不同。抖音頁面的預判不一樣,需要進一步推薦。頭孔功能“雙今日頭條+雙重封面”是一個實際應用。
案例C(A和B,抖音頁面相同但細節頁面不同):典型的例子是紅燒豬肉的做法,郭德綱的最新搞笑漫畫等,雖然點擊后的消費者體驗不同,類似抖音頁面演示讓用戶對消費者決策感到困惑。
如果用戶點擊A的內容,他會認為B的內容與A的內容重復,因而忽略它;如果用戶在抖音頁面上看到它但沒有點擊內容,他將極有可能錯過內容B.在這種情況下,應該延長兩個內容的推薦間隔并將其視為密集中斷問題。
案例D(A和B抖音多少能上熱門,抖音頁面和詳細信息頁面不同):這種情況最簡單。兩個完全不同的內容不會對用戶的消費預測產生影響,可以單獨推薦。
2.推薦密集
我們繼續討論重復的問題。強化意味著用戶推薦抖音中相同類型內容的比例過高,導致本地多樣性的喪失。
強烈推薦的原因是用戶的短期興趣點通常是明確的,并且將很快關注特定事件或人。例如,當閱兵式參加閱兵時,即使是嬌小的女孩也會被解放軍的冷靜和英雄姿態所吸引。在閱兵式周圍,將有不同的切入點,如軍事分析,士兵和英雄,以及愛國主義。隨著熱點,人們在這個階段的消費也將大幅增加。
另一方面,推薦系統不能充分理解用戶的興趣點,或者僅追求面向點擊并且擴大用戶的強烈興趣相關內容,從而忽略用戶的弱興趣相關內容。例如,系統只知道用戶喜歡財務,并且建議圍繞財務內容,或者比較由財務內容和科學內容組成的候選內容,因為財務內容點擊預測明顯高于科學內容,系統只推薦財務內容。
從點擊率的角度來看,本地密集型會滿足用戶的需求,這通常會導致短期消費的快速增長。這不一定是壞事。我們在關于用戶冷啟動的部分中也提到,為了在短期內留住用戶,系統會故意犧牲多樣性并滿足用戶的新熱點內容的短期需求。
但是,不同用戶的短期興趣點的衰減率是不可預測的。例如,第三天可能沒有提到閱兵的內容。自賽季結束以來,NBA的賽事報道一直沒有更新。為了防止用戶體驗從懸崖上掉下來,
從產品的角度來看,我仍然希望避免刷新時內容過于密集的情況。通常,我們采用滑動窗口規則,即多個連續規則盡可能多維分解,降低了用戶的視覺密度。
密集測量取決于我們對分割維度內容的理解,可以分割的維度越詳細,可以制定的分解策略越詳細。典型的可拆卸維度是主題載體維度抖音多少能上熱門,作者維度,類別(主題)維度和實體詞維度。
主題載體維度:屬于同一內容載體的內容太多,例如,屏幕是視頻或地圖集。
作者維度:來自同一作者的內容太多,例如大量媒體類型帳戶刷卡的現象。
主題和作者屬于內容的內在屬性,類別和實體詞是基于語義理解提取的屬性。
類別(主題)維度:來自同一類別(主題)的內容太多,例如關于閱兵期間閱兵的大量內容。
實體詞維度:討論實體詞的過多內容,例如關于明星名人的各個維度的討論。典型的例子是馬云,它涵蓋了金融,科技,教育等諸多領域。在系統準確進行類別識別的前提下,依靠類別分解無法解決馬云刷牙的問題,只能通過物理詞匯。散。
關于密集分手的好處,我們通常衡量用戶的長期保留。具有更好多樣性的內容可能會在短期內降低點擊率,但從長遠來看,它將有助于用戶留下來,并且沒有必要長時間競爭。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。