时时彩玩法韦莫利用进化竞争来改进其自动驾驶

[field:click/]次浏览 已收录

  
     
       当你需要使用大量的计算能力来并行地训练系统,或者让研究人员花很多时间手动淘汰坏的系统时,训练自动驾驶汽车的人工智能的过程很少有效率。Waymo可能有一个更聪明的方法:使用指导进化的相同原则。该公司与DeepMind合作开发了一种行人检测的“基于人群的培训”方法,该方法具有最好的神经网络,在自然选择方面与生命形式非常相似,节省了时间和精力。

  这种方法经常让网络相互竞争,较弱的例子被更强的“后代”所取代,后者是性能更好的网络的副本,其参数稍有调整(就像孩子不是其父网络的完美克隆一样)。这会自动消除性能较差的网络,同时避免Waymo从零开始重新培训网络——他们已经从父母那里继承了专业知识。这种方法过于注重短期改进存在风险。为了解决这个问题,Waymo创造了一个“小环境”,在这个环境中,神经网络在小组中相互挑战,以获得强有力的结果,同时保持更适合真实驾驶环境的多样性。

  该结果在行人检测中具有良好的应用前景。PBT方法减少了24%的假阳性率,尽管它花费了一半的时间。实验进行得非常顺利,Waymo甚至在其他模型中使用了PBT。反过来,这就保证了自动驾驶汽车能够更好地应付驾驶的复杂性并避免碰撞。