在当今互联网时代,视频平台无疑扮演着重要的角色。作为全球最大的视频分享平台,YouTube的视频推荐算法一直备受关注。最近,谷歌研究人员发表了一篇论文,详细阐述了YouTube的视频推荐方式。本文将为您总结这篇论文的主要内容。
解决的问题
YouTube的视频推荐系统需要同时优化不同的目标:一方面要提高用户的参与度(点击、观看时长),另一方面要提高用户的满意度(点赞、收藏)。同时,还需要减少系统中推荐位置引入的选择偏差,因为用户更倾向于点击排在前面的视频,尽管排在后面的视频可能带来更高的参与度和满意度。
采用的方法
YouTube的研究团队采用了一种广度和深度(Wide \u0026 Deep)的模型架构来解决上述问题。该模型结合了广度线性模型(记忆)和深度神经网络(归纳)的优势。Wide \u0026 Deep模型会为每个目标(参与度和满意度)生成预测,再通过一个单独的排名模型对这些预测结果进行加权组合,从而得到最终的推荐顺序。
在Deep部分,研究团队采用了MMoE(Multi-gate Mixture of Experts)模型,将当前视频的特性和正在观看的用户信息作为输入,利用不同的Expert来预测不同的目标。通过softmax gate函数,MMoE模型可以根据不同目标的相关性,灵活地确定哪些Expert对于特定目标更加重要。
在Wide部分,研究团队使用了一个"浅塔"(shallow tower)模型,利用简单的特征(如视频点击位置和观看设备)来减少系统中推荐位置引入的选择偏差。Wide部分的输出与MMoE模型的输出相结合,形成最终的推荐结果。
结果如何
研究结果表明,使用MMoE替换shared-bottom层可以提高模型的参与度和满意度。增加MMoE中的Expert层数量和乘法的数量,还可以进一步提高模型的性能。
此外,通过减少由于使用浅塔而导致的选择偏差,参与度度量也得到了改善。这比仅在MMoE模型中添加输入特性的方法更为显著。
值得一提
1. 尽管谷歌有强大的计算基础设施,但他们仍需要注意训练和服务成本。
2. Wide \u0026 Deep模型可以让您在设计网络时预先定义对您很重要的特性。
3. 当您需要一个具有多个目标的模型时,MMoE模型是一个有效的选择。
4. 即使拥有强大复杂的模型架构,人们仍需要手动调整最后一层的权重,以确定实际的排名。