沃尔玛正致力于构建一个零售图谱(Retail Graph),捕捉有关产品及其相关实体的知识,以帮助顾客更好地发现产品。这个产品知识图谱可以在零售环境中回答有关产品和相关知识的问题,可用于语义搜索、推荐系统等。本文将详细介绍沃尔玛是如何构建这个零售图谱的。
电子商务目录是通过从卖家、供应商/品牌获取数据而创建的。但合作伙伴提供的数据往往不完整,还存在错误信息。除了合作伙伴的数据,互联网上还有许多非结构化数据,如产品手册、产品评论、博客等。沃尔玛希望通过构建这个零售图谱,捕捉产品及相关实体之间的连接,以帮助顾客更好地发现产品。
在研究过沃尔玛的产品目录后,我们知道在构建这样一个系统时会遇到一些挑战。最大的挑战就是缺乏产品数据的唯一权威来源,以及合作伙伴提供的错误数据。因此,沃尔玛首先建立了一个二分图,一边是生成的,另一边是相关实体,并利用现有的分类方法来丰富实体,最后连接产品与实体。
接下来,本文将进一步阐述零售图谱的构建过程,包括实体提取、实体链接、实体管理,以及产品与产品之间的关系识别。同时也介绍了沃尔玛内部应用程序中相关的应用场景。