亚马逊在全球14个国家/区域运营,其间有9个国家/区域有资历享用其Prime年度订阅服务。毋庸置疑,该公司的确巴望以多种言语供给其购物体会,尤其是在运用不同方言的客户正在查找相同产品的情况下。

为了寻求一种有用的翻译多种言语的办法,亚马逊研究人员规划了一种购物模型,称为多使命模型,该模型中的功用在各个使命之间堆叠,而且往往会互相加强。他们说,他们的AI一起接受了几种不同言语的数据练习,因而运用其间任何一种言语都能发生更好的成果。

正如亚马逊运用科学家Nikhil Rao在博客文章中解说的那样,改进的原因是,一种言语的语料库能够添补另一种言语的语料库的空白。例如,法语中简单混杂的短语或许看起来不像德语中的短语,因而多言语练习能够协助加深几个产品查询之间的差异。

这些图画以意大利语和英语描绘查询和产品阐明的嵌入。左面是别离练习四个单言语模型而发生的嵌入;意大利语和英语的查询(橙色)和产品描述(蓝色)(英语和绿色和黄色)集合在该空间的四个不同区域中。右侧是在英语和意大利语数据上一起练习多使命模型而发生的嵌入。

团队的体系将与产品和产品阐明有关的查询映射到表明空间的相同区域中,而与言语无关,首要是为了协助模型将其从一种言语中学到的常识推行到其他言语。例如,查找“男生校园鞋”和“擦鞋”终究在该空间的一个区域中互相接近,而产品名称“ Kickers Kick Lo Vel儿童校园鞋–黑色”和“ Kickers Kick Lo婴儿班比诺” 《 Scarpe Nero》终究在另一个区域完毕。

体系接纳两个输入-一个查询和一个产品标题-而且输出一个位,指示该产品是否与查询匹配。编码器组件利用了Google的Transformer架构,研究人员说,该架构的扩展性优于其他架构,而模型的分类器则将查询编码和产品编码结合在一起。

亚马逊研究人员以多种语言权重蓝筹股有哪些股票训练了AI模型以改善产品搜索

团队经过随机挑选一种输入言语并“教”该体系以仅运用该言语对查询产品对进行分类,从而对该体系进行了练习。然后,他们在一系列年代中对它进行了端到端的练习-完整地展现了数据集-在每种输入言语的带注释的样本查询上。调整阶段经过最小化产品标题和查询的编码之间的间隔,保证针对不同言语量身定制的输出同享一个表明空间。

亚马逊表明,在触及10种不同双语模型(5种模型,每种模型与其他4种模型配对),10种三语模型和1种赏罚模型的试验中,他们在短短15或20个时期内就取得了“显著成绩”。依据F1分数(F1分数),这是AI中一种会误报和误报错误率的常见性能指标,运用法语和德语进行练习的多言语模型的作用比运用单一言语的法国模型高出11%,而运用单一言语的德国模型则胜过5%。别的,运用五种言语(包含法语和德语)练习的模型比法语模型高24%,比德语模型高19%。

“成果表明,多语种形式应该为咱们的客户供给更共同满足的购物成果,” Rao说。 “在正在进行的工作中,咱们将持续探究多使命学习的功用,以改进客户的购物体会。”