Professional and persistent, keep improving
短視頻推薦算法中(zhōng)的數據收集是怎樣的?
1.用(yòng)戶行為(wèi)數據
浏覽曆史:這是最重要的數據之一。算法會記錄用(yòng)戶觀看過的視頻,包括視頻的主題、類别、時長(cháng)等信息。例如,如果用(yòng)戶經常觀看體(tǐ)育賽事的短視頻,系統就會标記用(yòng)戶對體(tǐ)育内容有(yǒu)興趣。
點贊、評論和轉發:這些互動行為(wèi)能(néng)夠強烈地體(tǐ)現用(yòng)戶的喜好。點贊表示用(yòng)戶對短視頻内容的認可(kě);評論則反映了用(yòng)戶更深層次的想法,可(kě)能(néng)是對内容的提問、補充或贊美;轉發意味着用(yòng)戶希望将這個視頻分(fēn)享給更多(duō)的人,也說明用(yòng)戶認為(wèi)這個視頻有(yǒu)較高的價值。比如,一個用(yòng)戶頻繁點贊和評論美食制作(zuò)短視頻,并且經常轉發給朋友,算法就會判定該用(yòng)戶對美食制作(zuò)内容有(yǒu)較高的興趣。
關注列表:用(yòng)戶關注的賬号代表了他(tā)們長(cháng)期感興趣的内容領域。如果一個用(yòng)戶關注了許多(duō)健身博主,那麽算法會傾向于認為(wèi)該用(yòng)戶對健身相關的短視頻有(yǒu)持續的需求。
搜索記錄:用(yòng)戶在平台内的搜索關鍵詞也能(néng)體(tǐ)現他(tā)們的興趣點。例如,用(yòng)戶搜索 “旅遊攻略”,說明他(tā)們可(kě)能(néng)正在計劃旅行或者對旅遊相關的短視頻感興趣。
2.視頻内容數據
标簽:創作(zuò)者在發布短視頻時會給視頻添加标簽,這些标簽通常描述了視頻的主題、類型、風格等關鍵信息。比如一個旅遊短視頻可(kě)能(néng)會被貼上 “旅遊”“風景”“攻略” 等标簽。
視頻類别:平台會對短視頻進行分(fēn)類,如生活記錄、知識科(kē)普、才藝展示等類别。這有(yǒu)助于算法在推薦時,從相應的類别中(zhōng)篩選出符合用(yòng)戶興趣的視頻。
視頻時長(cháng)、畫質(zhì)等基礎信息:這些因素也會在一定程度上影響推薦。例如,對于喜歡快速獲取信息的用(yòng)戶,算法可(kě)能(néng)會推薦時長(cháng)較短的短視頻;對于對畫質(zhì)要求較高的用(yòng)戶,畫質(zhì)較好的短視頻可(kě)能(néng)會優先被推薦。