TopShelf:如何安排一个页面的产品,而不是仅仅在一个列表中排列它们

2020年5月5日

丹尼尔·桑德斯

许多对产品列表或搜索结果进行排序的方法都是基于给每个条目分配分数并按降序排序——换句话说,贪婪排序方法。在电子商务中,预测模型将客户最有可能感兴趣的产品放在最前面,然后是第二可能感兴趣的产品,以此类推。但是实体店的店主知道货架布局是关键,而且产品的吸引力不是固定的质量:它实际上会随着产品出现的环境而变化。例如,在同一类别的昂贵商品旁边放一件便宜的商品,可以展示它们的最大优势,突出其中一件的节俭和另一件的奢侈。当货架布置得很好时,即使个别产品销量较低,整个商店的销量也会更高。这种现象进行了研究营销心理学的标题下环境影响包括等现象的吸引力,折衷,而且相似的效果。

在Wayfair,我们在给定时间使用该预测ATC的概率(加入购物车),一个国家的最先进的深度学习模型对每个产品的客户。页面中的项目的ATC概率用于实时该页面进行排序。这种做法对我们来说非常成功,但它假定该产品的本地环境没有关系。然而,网站上的产品几乎都在列表中显示与邻居,要么上方和下方,或周围的一切产品中的网格。通过优化布局网页作为一个整体的我们可以共同提高客户体验和网站性能更进一步。我们可以训练一个模型,它是一个产品的邻国,包括价格,销售标志饱和度和视觉多样性的性质敏感,没有关于影响的方向做任何假设。例如,多样化的选择可以帮助销售艺术墙(其中品种将使其更容易扫描看起来各式各样的),而在厨房用具的类别的人可能更喜欢比较同类项(其中相似性将使其更容易的找到菜刀的确切合适的款式,例如)。

要做到这一点,我们开发了一种新的模式,称为TopShelf-充当的扩展,这种现有的产品排名算法,并利用产品的并置,使列表或网格作为一个整体光泽。它认为浏览页面为一系列的“货架”,并采用了前几名货架之间的预测模型来重新整理项目最大的吸引力在页面上。本文的其余部分解释它是如何发展的。

第一个挑战:定义上下文

为了训练一个模型来安排对本地上下文敏感的浏览页面,我们首先必须定义如何表示该上下文,包括它将到达的范围。假设我们在Wayfair上定义了沙发的上下文沙发浏览网页在它周围的所有其他沙发的摆放的位置上。鉴于16000个沙发在我们的目录中,可能的上下文的数量很快就会变得不可收拾!即使我们限制的背景下可能出现一个浏览页面上的48个产品,仍然会留下1.24×1061可能的安排,超过原子组成地球的号码!

虽然寻找一种方式来驯服的可能性,以评估组合爆炸,我们注意到,大多数显示器只显示产品一行在同一时间。因此,我们的假设是,在这种情况下,最相关的本地环境是出现在同一行或“架子” -of产品格的产品,并在货架上的确切顺序是尽管其他更广泛的那么重要上下文的定义-reaching也是可能的,有效的推荐的产品意味着我们选择了上下文的狭义的定义,可能还是捕捉重要邻国的重要作用列出的需要。

根据上下文给产品评分

定义这个上下文之后,第一步我们对优化整个页面是建立一个新的模型得分排名的产品,不仅对客户在某种程度上他们的浏览过程,而且对所有可能的产品可能出现的上下文。当然,训练数据并没有包含每一个产品的每一个可能的上下文,但是在Wayfair的产品网格中有足够的变化,我们仍然能够概括邻居的属性的影响。

我们这个模型构建的训练数据集不仅包含产品和客户属性,但也从同一货架上发现的另外两款产品衍生的新功能列。这些功能包括邻居的价格,他们的销售情况(他们有没有在角落里一个“买卖”标志),他们的产品图片多远是从目标产品的图像视觉嵌入空间。使用这个数据集,我们就培养了深层神经网络,就像我们对于我们普通的个性化排序算法做。

在得到的模型中,分数——表示产品在客户旅途中的某一点的价值——会因邻居的不同而有所不同(示例见图1)。有些产品对环境非常敏感,有些则不然。在本例中,目标床(左边)的分数在邻居更贵、视觉上更遥远、销售标志更少的情况下要高得多。

图1:模型可能得分相同的产品更高或者根据附近的产品相同的虚拟货架上降低。在这种情况下,当邻居们都更便宜,更相似,并在销售,模型分数左边比他们更便宜,更不同,不是所有的销售更高的床。

事实上,在这个例子中,邻居的视觉距离和s之间存在稳定的线性关系核心由模型分配,以及邻居的价格和分数之间。参见图2这种关系的图解。

图2:通过上下文reranker性质的产品的分数将取决于上下文。这些图表示出两个相邻的可视距离(其捕获视觉多样性)和邻居的价格和对一个特定床模型得分之间的正相关性。

虽然这是很难概括的上下文特征的影响,因为效果可以通过其他特性来调节,我们经常会看到更高的价格和多样化翻译的这种现象,以更高的预测ATC率。但神经网络能够捕获所有的高阶相互作用和类别的特定现象能够改变的语境效果。添加提供了在两个MSE和AUC模型试验性能有显着增加,这些上下文特征。

TopShelf:使用内容Reranker页面优化

有一个情境排序模式使我们能够预测有多好每一个产品将在一个特定的地方背景做。但是,我们仍然需要翻译成建设一个更优化的页面布置。与此相反,以基本的排名算法试图优化的页面作为一个整体时,不考虑背景下,将产品不再是简单降序得分顺序排序。这是必要的,以评估产品在众多可能的上下文,而当它们被放置他们又将提供上下文等产品。虽然假设上市较早的帮助,以减少的可能性,每一个潜在的货架需要三个神经网络的评价,或约50,000为每一个浏览页面加载,这可能会增加不可接受的滞后。通过专注于优化顶部的每一页上的15款产品,(前5个货架的3个产品),我们能够削减我们的搜索空间下降到455架,或1365分的评价,以及或者这个号码可以按比例上下取决于性能需要。

Wayfair的新算法TopShelf使用了这种使用本地上下文的客户行为模型,将产品安排在页面顶部最关键的位置。TopShelf类似于一个基本的排序算法,它贪婪地选择得分最高的商品,然后从剩下的商品中选择最好的,直到没有选择为止。但是TopShelf不是对产品进行排名,而是对可能的货架进行排名。如图3所示,当选择一个货架时,包含这些产品的所有其他货架将从下一轮评分的考虑中删除。

图3:TopShelf的步骤,利用内容排名模型来贪婪地选择得分最高的货架,并安排前15名的产品。

在开发算法时,我们面临的一个挑战是如何根据每个产品的上下文来给整个货架打分。第一种方法是取每个架子上的分数的平均值。然而,线下评估(如下所述)表明,为了使整个页面的销售最大化,最好选择最好的货架最大值它的组件项的分数(这个概念如图4所示)。

图4:根据我们的标准深度学习算法或TopShelf对产品进行不同排列时,前15名产品的得分。TopShelf算法构建的货架提高了货架上最左边商品的得分,有时会以牺牲货架上其他商品的预期吸引力为代价。

页宽性能提升离线评估

该建议在团队使用Wayfair严格离线评估之前,任何试射新车型比较以前的基准线,根据历史数据计算指标,如NDCG和召回。然而,这些指标奖励算法只用于放置这实际上是由客户选择为高的排名越好,而忽略对客户行为的附近的产品的效果的项目。度量捕捉这些影响和奖励助推页面的整体ATC率应该更好地满足我们最关心的,整体的ATC率的产品页面的关键绩效指标的在实践表现。

因此,我们训练了一个模型来预测整个页面的ATC率,根据单个产品的上下文排名分数、位置效应和产品类别的组合,因为页面上较高的位置会得到更多的关注,而不同类别之间的ATC率也有很大差异。在我们研究的高流量类别中,相对于基本的排名算法,TopShelf将页面的ATC率提高了大约5%(参见图5中的类可视化)。

图5:在项目的页面由基本深度学习模型重新分级,网页作为一个整体的估计ATC率提高。然而,当他们进一步TopShelf重新排列,这种估算增压进一步的取样,所有六个顶班增加。

在此开发期间,我们还对生产环境中的运行时进行了优化,因为算法运行所需的时间都是在现有推荐系统所需的时间之上添加的。

我们永远不会结束

TopShelf是一种进入前沿领域的方法石板优化,并有一些新兴的技术,我们希望作为替代在未来方法来评估。TopShelf充分利用我们现有的推荐引擎,在浏览网页的顶部有效地优化最赚钱的插槽,它会考虑提供上下文的利益的一个关键第一次测试。这是该公司在推荐策略的新方向显著,从时间到页面的整体优化一个产品。一旦这一概念已被证明为浏览网页,它可以被应用到每一个网站的一部分显示在产品方面:销售网页,电子邮件,“客户也查看了”旋转木马,等等。和邻近的产品的许多其他功能,可以添加。随着深层神经网络功能中捕获相互作用的力量,我们可以在任何情况下都是影响资本,不只是那些发现并在营销心理学效应是强大的或微妙的,个性化的或通用的,积极或消极,直接或命名互动与其他效果。背景的重要性!

提交评论

注意:您的电子邮件地址才能添加注释,但将不会被发表。