近日,ACM国际多媒体会议(ACM Multimedia 2023)举办的社交媒体UGC热度预测比赛(Social Media Prediction 2023)公布了最终成绩,其中,网易从全球工业界和学术届的众多参赛队伍中脱颖而出,超过去年阿里达摩院创造的记录,夺得冠军。据了解,网易从2017年开始在十余款游戏落地UGC推荐场景,针对多种UGC场景沉淀了具有业界领先水平的通用建模方案。
ACM MM(ACM International Conference on Multimedia)是计算机图形学与多媒体领域的顶级国际会议,也是中国计算机学会(CCF)推荐的A类学术会议之一。由全球最大、影响力最广的国际计算机学会 ACM(Association for Computing Machinery)发起,其评选的图灵奖(A.M. Turing Award)更是计算机领域的最高荣誉。这一荣誉的取得,不仅证明了该团队在推荐算法技术领域的卓越能力,也进一步展示了网易在推动AI技术应用方面的领先地位。
本次赛题是社交平台多媒体UGC内容的热度预测,涵盖了照片、用户信息、图像、文本、时间等多模态信息,对技术要求跨越了自然语言处理(NLP)、计算机视觉(CV)、推荐系统(REC)等多个领域,对技术储备是个不小的挑战。面对这一挑战,网易凭借多年在UGC业务中的技术积累和方案打磨,将业务中积累的算法模型迁移到比赛中,从比赛伊始就一路领先,最终获得了冠军的殊荣,且相关论文也被会议接收,彰显了卓越的技术实力和创新能力。
在游戏领域,UGC 可用于扩展游戏体验、提高用户参与度和留存率,是一种具有成本效益的营销形式。丰富、与众不同、个性化的UGC内容,不仅能够满足用户多样化的需求,也使产品更具吸引力和互动性,更能增加用户黏性。玩家自制的内容不仅能让现有的用户持续体验到新鲜感而留存,还能在社交平台上进一步扩散,吸引更多潜在用户。
对于UGC推荐,他们将问题理解为以下几个方面:
1. 玩家体验和作者体验的平衡:从玩家体验的角度出发,分发的应该是最热门的内容和最符合玩家偏好的内容。然而,对于一些作者的新作品,由于缺乏历史数据,难以确定用户是否会喜欢,因此不会将其直接分发给用户。这种做法会导致严重的马太效应,使新的优质内容难以成为热门,也无法激励作者,不利于长远发展。
2. 多模态特征的重要性:UGC内容以绚丽的Feed流形式呈现给用户,一张卡片所能承载的信息有限而珍贵。除了常见的标题、作者、简介等文字信息外,还蕴含着推广图、快照短片等引人入胜的图片信息,主题音乐等音频信息,以及点赞数、浏览数等统计信息。然而,仅凭统计数据和用户行为序列这些容易建模的信息,我们只能勉强揣测用户的喜好。这种粗略推断既无法充分发掘UGC内容的潜能,又容易受到马太效应的限制,无法真正“激活”未被挖掘的优秀内容。
3. 内容冷启动的难点:毋庸置疑,卓越的内容必须获得足够的曝光,方能充分验证其卓越之处,并找到那些真正喜欢它的用户。那么,我们是否可以通过冷启动的方式为其提供曝光呢?然而,曝光流量可贵无比,给予过多的冷启动机会可能导致内容受众的减少,直接影响用户体验,更不用说某些敏感玩家只是试探性地探索一番,若未能吸引他们,他们很可能会迅速离开。因此,除了前文提及的文字、图片、音频等内在信息可用于冷启动之外,还必须考虑用户特征以及在短暂曝光后对内容曝光的增加或降低,以及曝光应更多面向哪个群体。所有这些要素都必须被充分考虑,方案的复杂度呈指数级上升。
4. 分发多样性的必要性:为了实现长远发展,不仅需要给与用户当下最满足需求的内容,还需要提供多样化的内容选择,丰富用户的阅读和观看体验。用户不再局限于热门内容,而是能够发现更多风格各异、独具特色的作品。这种多样性不仅能够满足用户的个性化需求,也能够拓宽用户的视野,让他们体验到更多不同领域的精彩内容,提升用户的长期体验。
5. 数据的稀疏性:数据稀疏性呈现出双重维度的挑战,即用户行为的稀疏和UGC内容的反馈稀疏。这种稀疏性使得我们难以准确揣摩用户的偏好,也让一些卓越作品黯然失色。为了克服数据的稀疏性,我们需采用创新的数据采集和分析方法,结合实时用户反馈和行为数据,甚至在游戏业务中善用其它场景的用户行为。借助这些手段,我们能以更迅速、更全面的方式洞察用户需求,为他们提供更加丰富、个性化的内容推荐。当我们克服数据的稀疏性时,才能真正激发卓越作品的潜能,提升整体用户体验,推动UGC平台踏上可持续发展之路。
网易自2015年起,一直致力于在游戏中利用数据智能技术改善玩家体验,在精细化运营、个性化推荐技术领域助力上百款产品实现营收增长。 对于UGC业务,他们已经沉淀了一套高效的接入方案, 当前接入的业务涉及UGC地图推荐、社区帖子推荐、UGC外观推荐、直播推荐等,均在参与率、游玩时长等指标上获得提升。