如果有满足的练习数据,大街导航AI是否能够遍历曾经看不见的街区?这便是Google母公司Alphabet的DeepMind的科学家们在预印本服务器Arxiv.org上宣布的一篇新宣布的论文(“街头导航的跨视图方针学习”)中的查询。在其间,他们描绘了运用自上而下的视觉信息将运用地上视图语料库练习的人工智能方针搬运到城市的方针部分,他们以为这种办法能够更好地推行。

DeepMind的AI使用空中和地面视图数据来导航看不见的区股票的k线是什么意思域

该论文的一起作者说,这项作业的创意来自人类能够经过阅览地图快速习惯新城市的调查。

“在不熟悉的环境中从视觉调查中导航的才能是智能署理的中心组成部分,也是一项继续的应战…… [G]致力于大街导航的署理人到目前为止还未能在没有很多再练习的情况下搬运到看不见的区域,依赖于仿真不是一种可扩展的解决方案,“他们写道。 “咱们的中心理念是将地上视图与鸟瞰图配对,并学习可跨视图转化的联合方针。”

研究人员首要收集了区域航空地图,他们依据相应的地理坐标与大街视图配对。接下来,他们开端了一个由三部分组成的搬运学习使命,该使命经过运用鸟瞰图方针区域观测进行源区数据和习惯性练习,最终经过运用地上调查调查搬运到方针区域。

该团队的机器学习体系包含三个模块,包含担任视觉感知的卷积模块,捕获特定方位特征的长时间短期回忆(LSTM)模块,以及发生动作散布的战略循环神经模块。它被布置在StreetAir,这是一个多视图的野外大街环境,建立在StreetLearn之上,这是一个来自谷歌街景和谷歌地图的互动第一人称全景街景照片集。在StreetAir和StreetLearn中,组织了纽约市(纽约市中心和纽约市中心区)和匹兹堡(阿勒格尼和卡内基梅隆大学校园)的航拍图画,在每个纬度和经度坐标处,环境返回了一个84 x 84的航拍图画。与坐落该方位的中心的地上视图图画巨细相同。

人工智能体系一旦经过练习,其使命是学习本地化并在给定方针目的地的纬度和经度坐标的情况下导航全景图画的街景图。掩盖两边2-5公里区域的全景图距离约10米,AI引导署理每回合五次动作中的一种:向前移动,向左或向右转22.5度,或向左或向右转67.5度。在到达方针100-200米范围内时,这些署理人取得奖赏以加强导致快速精确遍历的行为。

在试验中,运用空中图画以习惯新环境的署理人取得了190亿过程的奖赏衡量和280亿过程的奖赏衡量,这两者都明显高于仅运用地上数据的署理人(50 1亿步,200步2亿步)。研究人员表明,这表明他们的办法明显提高了署理人获取方针城市区域常识的才能。

“咱们的结果表明,与单视图(地上)比较,所提出的办法将署理搬运到具有更高零射击奖赏的无法看到的区域(在坚持的地上视图环境中无需练习的搬运)和更好的全体功能(在搬运期间接连练习)检查署理商,“该团队写道。