eBay是一个全球性的电子商务平台,拥有数以百万计的商品供买家选购。为了帮助买家轻松找到喜欢的商品,eBay利用深度学习技术对商品标题进行分析,提供更加相关的推荐。本文介绍了eBay在这方面的探索和实践。
通过利用深度学习技术来比较产品列表的标题,我们大大提高了 eBay 的"查看项目"页面上推荐项目的相关性。
买家的购物旅程有不同的阶段,通常称为"漏斗"。在旅程的"漏斗下游阶段",买家在 eBay 市场中确定了他们感兴趣的产品或项目类型,并点击了产品列表。在产品列表页面,有几个模块根据不同的主题向买家推荐商品。
我们的 Promoted Listing SIM (PLSIM) 排名引擎分为三个阶段。它:
1. 检索与种子项目最相关的候选 PLS 项目子集("召回集")。
2. 应用训练有素的机器学习排名器根据购买的可能性对召回集中的列表进行排名。
3. 通过纳入卖家广告费率对列表进行重新排名,以平衡通过促销实现的卖家速度与推荐的相关性。
我们的推荐排名模型中最有影响力的特征集之一与买家当前正在查看的商品标题与推荐的候选商品之间的相似度有关。我们之前的推荐排名模型通过使用词频-逆文档频率 (TF-IDF) 和 Jaccard 相似度系数比较标题关键词来评估标题相似度.
我们引入了 eBERT,这是 BERT 的一个变体,它已经在 eBay 商品标题和维基百科语料库上进行了预训练,更适合 eBay 语言理解任务的需要。此外,我们还开发了一个名为 MicroBERT 的特定 eBay 模型,进行了针对 CPU 推理优化的BERT的较小版本。
我们利用从 Siamese MicroBERT 推断出的标题嵌入来计算"查看项目"页面上的项目标题与每个推荐项目候选标题之间的余弦相似度。我们的排名模型在购买排名(即已售商品的平均排名)上取得了3.5%的提升。
为了满足eBay的在线服务延迟要求,我们不是按需计算标题嵌入,而是每天离线运行批处理作业以生成eBay上列出的所有新商品的标题嵌入,并将它们缓存在NuKV中。
与之前的模型相比,新的排名模型显着提高了购买、点击和广告收入。A/B测试结果证实,在我们的推荐排名模型中结合基于深度学习的自然语言处理(NLP)技术可以捕获项目属性之间的语义相似性,从而推动更好的转换。