怎么理解端到端技术——来自rocky刘毅林_文章

六道萝卜

日榜 TOP{{detailStore.day_rank}}

月榜 TOP{{detailStore.week_rank}}

管理

怎么理解端到端技术——来自rocky刘毅林

文章

今天来给聊聊自动驾驶里一个特别热门的概念——“端味”。

简单来说，端味其实就是“人味”，听起来仅一词之别，但要理解透彻，咱得先搞清楚之前那些“不像人”的地方到底在哪里？今天就借用一下游戏类型，来先讲“三不像”：

第一个“不像”，横纵配合协调性。对比起来，这就好比神庙逃亡和马里奥赛车。

在神庙逃亡里，主要是在单一轨道内保持前进，纵向主要是跳跃，相对简单，横向的操作，是在左中右三条轨道里切换，非常固定。而在马里奥赛车里，车手可以根据赛道情况、对手位置、各种障碍和道具，动态地选择横向和纵向的控制幅度。

引申到自动驾驶里，以往的系统是以在单一车道内的居中保持为基础，纵向大于横向，所以比人类司机比例更高的出现纵向卡死，而现在通过大量数据训练的模型规控，就像马里奥赛车一样，学习人类在复杂路况下的选择，比如在城市道路上，遇到前方车辆加塞，系统会同时考虑横向避让和纵向减速的最佳幅度，不再是单一维度的简单操作，从三个轨道的跑酷游戏，变成了能在固定区间灵活游走的赛车游戏。当然也会开始产生类似人类的加塞失败的现象，甚至更多，为什么多的原因下回展开聊。

再说说第二个“不像”，决策之间的连贯性，类似火焰纹章与星际争霸的差异。

火焰纹章是回合制战略游戏，每个动作和决策都得等上一个结束了才能开始下一个，每一步之间都是思考时间，而星际争霸是即时战略游戏，玩家需要根据瞬息万变的战场形势，连续、紧密地做出各种决策。

在自动驾驶里也是如此，过去的一些规控系统，动作与动作、决策与决策之间是相对独立的，一旦遇到突变的场景，比如一台前方的左边的车快速靠右临停，就容易“烧脑卡死”，当然，也可以增加决策树的复杂性来解决问题，但再复杂的决策树也无法穷尽所有场景。但现在通过大量数据训练的模型规控，能更快、更细密地连接这些决策和动作，不停的从学习过的场景数据里“抽卡”，实现更流畅的决策过程，像从回合制战略迈向了即时战略。

最后讲讲第三个“不像”，场景处理的上限和自由度，类似最终幻想和Minecraft。

早先版本的日式RPG都是固定关卡、固定流程、单线结局的游戏，每个关卡基本有固定的解法。而Minecraft是超自由度的开放世界游戏，玩家可以利用游戏里的各种元素创造出无数种可能。

在自动驾驶中，哪怕是极其出色的规控系统，也会存在能力极限。但现在通过大量数据训练，模型规控可以在海量的数据支撑下，面对更多复杂的路况，拥有更加庞大的可能性，从固定流程的“JRPG”，变成了能在各种复杂路况下自由应对的“开放世界”模式，类似复杂交通状况下，也能有更丰富的应对策略。另一个最大的变化，也是未知场景的解决成本，不再是一个庞杂系统下的精密手术，而是数据熔炉里奔腾不息的数据。

@MrRocky 大佬很久没在新出行聊过了，上次和你互动还是几年前了

新出行小鹏社区

进主页

六道萝卜 Lv.1

获赞

关注

粉丝

原创

{{ recommend_circle[curIndex].series[0].price.price_type? recommend_circle[curIndex].series[0].price.price_text : '' }}
{{recommend_circle[curIndex].series[0].price.price_string}}