{{detailStore.author.is_follow?'已关注':'关注'}}
管理
怎么理解端到端技术——来自rocky刘毅林
文章

今天来给聊聊自动驾驶里一个特别热门的概念——“端味”。

简单来说,端味其实就是“人味”,听起来仅一词之别,但要理解透彻,咱得先搞清楚之前那些“不像人”的地方到底在哪里?今天就借用一下游戏类型,来先讲“三不像”:

第一个“不像”,横纵配合协调性。对比起来,这就好比神庙逃亡和马里奥赛车。

在神庙逃亡里,主要是在单一轨道内保持前进,纵向主要是跳跃,相对简单,横向的操作,是在左中右三条轨道里切换,非常固定 。而在马里奥赛车里,车手可以根据赛道情况、对手位置、各种障碍和道具,动态地选择横向和纵向的控制幅度。

引申到自动驾驶里,以往的系统是以在单一车道内的居中保持为基础,纵向大于横向,所以比人类司机比例更高的出现纵向卡死,而现在通过大量数据训练的模型规控,就像马里奥赛车一样,学习人类在复杂路况下的选择,比如在城市道路上,遇到前方车辆加塞,系统会同时考虑横向避让和纵向减速的最佳幅度,不再是单一维度的简单操作,从三个轨道的跑酷游戏,变成了能在固定区间灵活游走的赛车游戏。当然也会开始产生类似人类的加塞失败的现象,甚至更多,为什么多的原因下回展开聊。

再说说第二个“不像”,决策之间的连贯性,类似火焰纹章与星际争霸的差异。

火焰纹章是回合制战略游戏,每个动作和决策都得等上一个结束了才能开始下一个,每一步之间都是思考时间,而星际争霸是即时战略游戏,玩家需要根据瞬息万变的战场形势,连续、紧密地做出各种决策。

在自动驾驶里也是如此,过去的一些规控系统,动作与动作、决策与决策之间是相对独立的,一旦遇到突变的场景,比如一台前方的左边的车快速靠右临停,就容易“烧脑卡死”,当然,也可以增加决策树的复杂性来解决问题,但再复杂的决策树也无法穷尽所有场景。但现在通过大量数据训练的模型规控,能更快、更细密地连接这些决策和动作,不停的从学习过的场景数据里“抽卡”,实现更流畅的决策过程,像从回合制战略迈向了即时战略。

最后讲讲第三个“不像”,场景处理的上限和自由度,类似最终幻想和Minecraft。

早先版本的日式RPG都是固定关卡、固定流程、单线结局的游戏,每个关卡基本有固定的解法。而Minecraft是超自由度的开放世界游戏,玩家可以利用游戏里的各种元素创造出无数种可能。

在自动驾驶中,哪怕是极其出色的规控系统,也会存在能力极限。但现在通过大量数据训练,模型规控可以在海量的数据支撑下,面对更多复杂的路况,拥有更加庞大的可能性,从固定流程的“JRPG”,变成了能在各种复杂路况下自由应对的“开放世界”模式,类似复杂交通状况下,也能有更丰富的应对策略。另一个最大的变化,也是未知场景的解决成本,不再是一个庞杂系统下的精密手术,而是数据熔炉里奔腾不息的数据。

@MrRocky 大佬很久没在新出行聊过了,上次和你互动还是几年前了

写评论
积分赞赏
点赞
评论区
  • 编辑
  • {{is_favourite ? '已收藏' : '收藏'}}
  • {{is_personal_top ? '取消主页置顶' : '个人主页置顶'}}
  • 举报
  • 加入黑名单
  • 删除
  • 取消置顶
  • 置顶推荐
    • 6小时
    • 12小时
    • 24小时
    • 3天
    • 一周
    • 长期
  • {{digest?'撤销精华':'设为精华'}}
回到顶部
  • 全部评论{{detailStore.commentnum}} 条
  • 只看作者
  • 最热
  • 最新
  • 最早

「待审核」

首评 {{ comment.relativeTime }} 已被赞赏 {{comment.integral}} 积分 回复

{{ type!=10 ? '前排沙发空着~' : '暂无相关评论' }}

{{type!=10 ? '还没有人评论哦,快抢沙发吧!' : '发表一下个人看法吧'}}