Waymo和DeepMind模仿进化

2024-10-17 09:02:04 科技 >
导读 Alphabet的自动驾驶和robotaxi公司Waymo为了改进和改进为其自动驾驶软件提供动力的人工智能,我们进行了大量培训。最近,它与Alphabet公司

Alphabet的自动驾驶和robotaxi公司Waymo为了改进和改进为其自动驾驶软件提供动力的人工智能,我们进行了大量培训。最近,它与Alphabet公司和AI专家DeepMind合作开发了新的培训方法,有助于提高培训效率。两人合作推出了一种名为“基于人群的培训”(简称PBT)的培训方法,以应对Waymo构建更好的虚拟驱动程序的挑战,结果令人印象深刻--DemMind在博客文章中称,使用PBT的假阳性率降低了24%在Waymo车辆的许多传感器发现的行人,骑自行车者和摩托车手周围识别和放置箱子的网络中。不仅如此,还可以节省培训时间和资源,与Waymo之前使用的标准方法相比,使用了大约50%的培训时间和资源。

稍微退一步,让我们来看看PBT是什么。基本上,这是一种训练方法,它从达尔文进化论的运作方式中获取线索。神经网络本质上是通过尝试某种东西,然后根据某种标准来衡量这些结果,以确定他们的尝试是基于期望的结果更“正确”还是更“错误”。在Waymo使用的训练方法中,他们有多个神经网络在同一个任务上独立工作,所有神经网络都具有不同程度的所谓“学习率”,或者每次他们的方法可以偏离的程度他们尝试任务(例如识别图像中的对象)。较高的学习率意味着在结果质量方面更加多样化,但这种方式都有所不同 - 较低的学习率意味着更稳定的进步,

但是所有这些比较培训都需要大量的资源,并且从好的方面对好的东西进行分类依赖于个体工程师的直觉,或者是手工组件的大规模搜索涉及工程师“杂草” out“表现最差的神经网络,为更好的神经网络释放处理能力。

DeepMind和Waymo对这个实验做了什么实际上是自动化除草,自动杀死“坏”训练并用运行任务的最佳网络的更好性能分拆代替它们。这就是进化的来源,因为它是一种人工自然选择的过程。是的,这确实有意义 - 再读一遍。

为了避免这种方法的潜在缺陷,DeepMind在早期研究后调整了一些方面,包括快速,15分钟间隔评估模型,构建强大的验证标准和示例集,以确保测试真正构建性能更好的神经网络现实世界,而不仅仅是他们被喂食的特定数据的良好模式识别引擎。

最后,这些公司还开发了一种“岛屿种群”方法,通过构建仅在有限群体中相互竞争的神经网络子群,类似于动物群体从较大群体(即限于岛屿)切断的方式发展远不同的,有时更适应的特征与他们的大陆地表兄弟相比。

总的来说,这是一个非常有趣的看法,深度学习和人工智能如何对技术产生真正的影响,在某些情况下,我们的日常生活中已经很快就会发生这种影响。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

热门文章

热点推荐

精选文章