
- 全站推荐
- 全站置顶
- 首页推荐
- 社区推荐
-
置顶推荐
- 6小时
- 12小时
- 24小时
- 3天
- 一周
- 长期
- 设为精华
- 热门推荐
- 撤销审核
- 进小黑屋
- 生成议题
今天来给聊聊自动驾驶里一个特别热门的概念——“端味”。
简单来说,端味其实就是“人味”,听起来仅一词之别,但要理解透彻,咱得先搞清楚之前那些“不像人”的地方到底在哪里?今天就借用一下游戏类型,来先讲“三不像”:
第一个“不像”,横纵配合协调性。对比起来,这就好比神庙逃亡和马里奥赛车。
在神庙逃亡里,主要是在单一轨道内保持前进,纵向主要是跳跃,相对简单,横向的操作,是在左中右三条轨道里切换,非常固定 。而在马里奥赛车里,车手可以根据赛道情况、对手位置、各种障碍和道具,动态地选择横向和纵向的控制幅度。
引申到自动驾驶里,以往的系统是以在单一车道内的居中保持为基础,纵向大于横向,所以比人类司机比例更高的出现纵向卡死,而现在通过大量数据训练的模型规控,就像马里奥赛车一样,学习人类在复杂路况下的选择,比如在城市道路上,遇到前方车辆加塞,系统会同时考虑横向避让和纵向减速的最佳幅度,不再是单一维度的简单操作,从三个轨道的跑酷游戏,变成了能在固定区间灵活游走的赛车游戏。当然也会开始产生类似人类的加塞失败的现象,甚至更多,为什么多的原因下回展开聊。
再说说第二个“不像”,决策之间的连贯性,类似火焰纹章与星际争霸的差异。
火焰纹章是回合制战略游戏,每个动作和决策都得等上一个结束了才能开始下一个,每一步之间都是思考时间,而星际争霸是即时战略游戏,玩家需要根据瞬息万变的战场形势,连续、紧密地做出各种决策。
在自动驾驶里也是如此,过去的一些规控系统,动作与动作、决策与决策之间是相对独立的,一旦遇到突变的场景,比如一台前方的左边的车快速靠右临停,就容易“烧脑卡死”,当然,也可以增加决策树的复杂性来解决问题,但再复杂的决策树也无法穷尽所有场景。但现在通过大量数据训练的模型规控,能更快、更细密地连接这些决策和动作,不停的从学习过的场景数据里“抽卡”,实现更流畅的决策过程,像从回合制战略迈向了即时战略。
最后讲讲第三个“不像”,场景处理的上限和自由度,类似最终幻想和Minecraft。
早先版本的日式RPG都是固定关卡、固定流程、单线结局的游戏,每个关卡基本有固定的解法。而Minecraft是超自由度的开放世界游戏,玩家可以利用游戏里的各种元素创造出无数种可能。
在自动驾驶中,哪怕是极其出色的规控系统,也会存在能力极限。但现在通过大量数据训练,模型规控可以在海量的数据支撑下,面对更多复杂的路况,拥有更加庞大的可能性,从固定流程的“JRPG”,变成了能在各种复杂路况下自由应对的“开放世界”模式,类似复杂交通状况下,也能有更丰富的应对策略。另一个最大的变化,也是未知场景的解决成本,不再是一个庞杂系统下的精密手术,而是数据熔炉里奔腾不息的数据。
@MrRocky 大佬很久没在新出行聊过了,上次和你互动还是几年前了