5月19日凌晨, Google I/O 大会时隔两年线上重磅回归,带来了一系列的技术新进展,突破性会话式AI、全新多任务统一模型MUM、3D视频聊天、10倍性能TPU V4、还有Android 12重磅登场!
在电商购物创新上,推出 Shopping Graph 购物图谱,汇集各类网站商品信息,例如价格、库存等等,且这些数据都是直接通过品牌或产品零售商直接获得,并将陆续打通类似丝芙兰等商家的会员积分系统,展示最佳的购买方案。
在 Google Cloud 技术支持方面,电商零售行业一直占据着比较重要的地位,像我们今天会讲到的 Product Search 与 Recommendations AI 已经帮助许多零售商优化购物体验实现业务增长,那么这两个工具究竟是如何在电商场景下应用的呢?见下文👇
以图搜图的功能目前已经在很多平台被广泛使用了,用户通过上传实时拍摄的方式来进行目标的检索。尤其在主流的电商网站被用来进行商品检索,能够在很大程度上提升客户的购物体验。
那么, Google Cloud 是如何进行这一步的呢?
当用户上传图片进行产品检索时,API 会应用机器学习,将用户上传的图片与数据库中的商品图片进行对比,之后返回视觉和语义上都比较相似的产品排名列表,然后我们可以在该列表中进行筛选之后将结果反馈给用户。
视觉产品搜索其实是在预先训练好的机器模型上运行,而这些模型主要是针对图像的不同特种,比如颜色、形状、所含图案等进行训练,之后将具有相似特征的图形进行聚类,形成一个齐次的集合。
当用户检索图像的时候,API 会首先提取到被上传的图片的特征值,并去标识最有可能属于哪个群体,然后基于相似性索引,从集群中识别并输出与之最相似的产品的图片与详情等。
API 本身会返回一个分数,从零到一,即从无置信度到完全置信的降序排序,并会返回一些最佳匹配的结果。
上图比较详细的概括了 Product Search 工作的流程。
首先我们需要准备数据创建商品集合,其中上商品的参考图片等信息都需要通过数据集进行导入。商品的索引大约在每30分钟进行一次更新。
当进行图片添加或删除之后,索引会在30分钟之后进行更新,在这期间发生的变化是不会反映在当时的检索过程中的。
Product Search 使用步骤
首先需要创建空商品集,一个容纳某组商品的简单容器,可以将其理解为巨大的商品池子。
创建好商品集之后,再向其中进行商品添加,每个商品都需创建其参考图片。需要提醒的是,此数据集一定要精细维护,保证其完整性与及时性。
商品添加主要有两种方式,第一种是在线逐一导入,其好处在于便于维护数据集的整体架构,但操作相对来说比较麻烦;
第二种是通过 CSV 进行批量导入,可通过 API 的一次调用完成整个商品目录的导入。如果想要更好的完成商品导入,这里有一些小建议,商品图片最好是白色或是透明背景,且保证较高的图片分辨率,商品的特征尽量明显,这样会有利于机器更好的分析商品的显著性,更有利于检索结果。
这里需要说明一下, CSV 文件里需要包含哪些内容,如图2 ,第一例是图片的地址,可能是一个 Storage 的 URL 值;第二例是图片编号,可手动提供但要确保其唯一性,如果没有手动提供,系统会自动分配一个唯一值;第三例是数据集的编码,前文我们说过所存入的图片当属于某一个商品集;第四例为图片所属品类,目前支持的品类包括家装用品、服装、玩具等常规五大类,(创建参考图片的时候若没有指定其所属类别,系统会自动根据推测对其进行分类);至于 Labels ,key-value 键对值的字符串在开始的时候会对上传的图片进行过滤及简单的分类。
Product Search 实操测试
为了更为直观的测试 Product Search 的功能,我们也准备了数据集进行测试,该数据集中包含的商品包括服装、鞋子、背包等,数据条目在一万左右。下图为输出结果:
从输出的结果来看,连衣裙在商品集中并没有检索到非常相似的,返回的商品仅是比较接近的,置信度一般,没有较高的得分。而在后面的男士皮鞋、背包和 T 恤来看,返回结果与搜索目标较为接近,置信度有所提高。
这里总结一下,对于每一个商品类别,要想得到较高的置信度,最好准备大量的、分辨率较高的参考图片,同时对于一款产品最好可以提供多个角度的参考图像,更有利于系统参考比对。
Recommendations AI 在之前一直属于 Beta 版本,正式上线是在去年12月份(2020.12),近些年来,Google 一直在其 Google Ads 、Google Search ,以及 Youtube 等业务模块进行内容推荐,为了更好的读懂用户进行更加个性化的推荐, Recommendations AI 也一直在从中汲取经验。
在正式介绍之前,先简单的说明一个问题,在 Recommendations AI 中,客户的数据及模型指数与客户本人,任何 Google 产品及其其他的客户均不会进行触碰,并且这些数据及模型不会被锁定,客户随时可以根据自身的需求进行删除。同时,Recommendations AI 是符合欧盟 GDPR 一般数据保护条例要求的。
推荐系统是在不断完善进化的,在最开始的时候,系统会根据当下流行的商品进行推荐,即什么流行就推荐什么,在这个过程中不会给客户个性化的体验,仅仅是为了商品推荐,当然,商品的购买转化率没有得到较好的提升。
进入第二个阶段之后,系统会根据人群画像进行推荐,即首先判断客户属于哪一个群体,然后根据该群体所喜好的商品来进行推荐,如我们在生活中可能遇到过的推荐词条——“喜欢该商品的人还看过某件商品”。第二阶段的推荐系统在个性化与准确性上开始有所提升。
而 Recommendations AI 所要做的是根据用户的浏览记录即用户行为进行商品推荐,更加贴合用户偏好,进而提升购物体验。
为了更好的构建 Recommendations AI 模型,我们需要准备哪些信息呢?
如图4所示,我们主要需要提供两组信息:产品目录与用户事件,前者需要包含产品名称、库存情况、价格等,后者即终端客户在网站上进行了哪些行为,如检索、查看、购买行为等,这些数据都需要作为原始数据进行上传。
Recommendations AI 拥有整合非架构化原数据的能力,可以充分利用所有数据多维度分析来实现更贴合更完善的预测结果,不再仅仅是二维层面的较为强硬的推荐。
目前,Recommendations AI 支持四种推荐模型——【您可能喜欢的其他商品】、【经常一起购买】(会与购买车商品进行关联的其他商品)、【为您推荐】、【最近看过】。
每一个模型类别的优化目标、支持的用户事件有所差别,如【您可能喜欢的商品】该模型默认的优化目标是点击率,通过客户去看其他商品来保证其浏览时间;【经常一起购买】的优化目标为增加每一笔订单的金额。
与以往的推荐系统相比,Recommendations AI 采用 Google 最新的机器学习架构, 可动态适应客户的实时行为以及商品分类、价格和特惠等变数的实时变化。全球已有多家零售商开始使用 Recommendations AI, 并且在早期都表现出显著的改进, 有的甚至得到了下图的结果👇
Recommendations AI 刚刚上线不久,如果想了解更多信息或想要试用,可以点击原文或拨打下方电话与我们联系。
想获取更多谷歌云相关资讯及干货内容?
赶紧关注我们吧!点击“阅读原文”留下您的问题
会有专业人员与您联系哦~
📱:18651688484
📫:cloud@webeye.com