接上期文章。
本次WAIC2020上,Elon Musk所做的最精彩的回答,其实是后续两个问题的答复。在小编看来,可以说是问得漂亮,答得精彩。可难以置信的是这两部分的问答没能在舆论界掀起任何波澜,既没人讨论,也没人分析。所以在不知不觉中,我们其实忽略了Tesla和这位传奇CEO身上的最佳品质:对于技术的执着和对于边缘技术的狂热,不仅仅搭建出有说服力的商业帝国,更交织出其本身这么一个“怪兽工程师”。
【Elon Musk的商业帝国和其背后的相关技术】
这一阵子其实还有一个比较热门的话题,就是一位前奥迪研发管理人员以“沉睡多年的德国车企”为主题,写了一篇警示文章。在文章中,他警告说,如果再任由所谓的“血管里流着汽油”的传统的企业高管领导一个越来越有软件特色的新型汽车制造企业,结局必然是血淋淋的。他建议德国车企的高管选拔原则应当调整为,让候选人独立在规定时间内写一个具备可玩性的小游戏,或者一个基本可以工作的病毒…… 否则就无法拯救即将水深火热的德国汽车制造业。
如果大家对类似的思想口径可以接受,那么为什么看不到一个从12岁就开始编写游戏,大学未毕业就开始创立支付软件体系….. 一个纯粹的软件亲历者的优点呢?上图我们可以看到,在Elon Musk的个人创业和投资跨度中,新能源动力、新型航天和人工智能,构成了Elon Musk的能力三角,互相耦合、助力。如果Elon Musk保持其一贯的事必躬亲,亲历亲为参与设计和流程设计,那么他个人的技术起点就必然会原来越高越来越全面。
这是我们需要认真讨论他对于以下两个问题答复的原因。
对于AI的三分类,“Perception、Cognitionand Action”,套用在自动驾驶领域还是有点公差的。所以对这个问题的答复,Musk首先表示他不确定是否能对AI做这样一个分类。但这种分类方法并不妨碍展开谈AI的整体进展,所以Musk并没有在讨论中和自动驾驶结合得特别紧密。
在感知领域,Perception。Musk的答复是积极的,也是肯定的。这源自于这个技术分支上的整体高水平,也可能来自于Autopilot感知模块能力所带给Musk个人的直观感觉。在监督学习的深度神经网络体系下,各种对于语音、视觉信号的识别能力,有目共睹。Musk使用了一个技术上的说法,“byte stream”,对于任何给定速率的信号,现有的AI系统都可以做到比人类更好的水平。
我们可以这样理解Musk的观点。针对Autopilot系统来说,由于有Data Engine闭环的存在,道路目标和环境的视觉识别速度和准确度,对于Tesla来说已经不是主要问题。不论牵扯到具体哪一种AI训练/测试/部署技术,Tesla的现有架构都可以保证无限循环去搜集每一个长尾中的corner case,从而让运行中的Tesla车辆逐步逼近甚至超越人类的识别水平。
在认知领域,Cognition。对于这一点Musk明确表示了比较负面的观点。“Cognition, This is probably the weakest area.”考虑到Elon Musk实际掌控着若干家AI公司,涵盖从Tesla的深度学习网络技术到Neuralink的动物神经信息技术,因此小编选择相信边缘科学在这个角度的实际进展。Musk的直接观点是,AI虽然已经有这么长足的进步了,很多AI的实现在一些实际的工业领域已经相当不错了。但是在推理、创造力和自我演进这些Cognition相关方面就做得很不好。
如果衍生理解Musk的实际意思,Autopilot上的认知部分实际对应的就是“预测模块”的性能,以及藏在云端的Dojo系统工作在无监督学习下的实际性能表现,可能还是远远不能达到对生产力实际有帮助的境地(小编推测)。本质上讲,经过人类辅助训练的深度学习网络,在认知性能上,只能接近而不能根本性超越人类。只有在人类辅助中实现对自我学习的跨越,或自主推断/认知能力的产生,才是真正的Intelligence。这并非天方夜谭,当年叱咤风云的AlphaGo即属于此列。
在行为领域,Action。这是毫无疑问的,机器和软件算法,具备所有领先人类的特性。比如执行的精确度、超低时延、超高密度……等等,Musk打比方说任何有规则的游戏中,AI的执行能力都类似于超人。
关于这个AI相关问题的整体答复,除去Musk本人的高屋建瓴以外,如果要反过头来落地在Autopilot系统上,小编做一个总结,也是我们车右智能长期对于Tesla和Autopilot技术的关注和小小的总结:
第一,截至2020年3月,Tesla各型车辆累计生产并销售超过100万辆。即便是保守估计(小编没有这个准确数据),携带有足量传感器和自动驾驶硬件的车辆占比在60%以上至少。这意味着在全球范围内,Tesla的Fleet已经拥有60万辆以上,而且还在不断扩大中。这是Tesla的Autopilot系统全部的数据来源;(如下图)
第二,基于数量庞大的现实车队和视觉传感器阵列,Tesla目前可以确定的深度学习方法有:
1 人工标记手段,在监督学习的框架下,主要可以被用于针对autopilot系统的关键物体识别能力的训练(计算机视觉);在这个方向上投入足够的人力是关键,也是值得的,因为这是autopilot的基本能力;
2 影子模式/Shadow mode下,任何人类司机的驾驶行为和autopilot的驾驶行为有出入的地方,将会被上传云端,并被用于非监督学习的“新型场景鉴别和分类”;另,从某种程度上讲,人类司机的驾驶行为在此处如果被标记且一同上传,则可以进行质量更好的半监督学习,甚至监督学习。从某种意义上讲,这也是一种模仿学习;
3 从方法1和2中所获取的稀有场景,可以被进一步处理,比如人工标记之后,返回给整体fleet,进行相关/相类似的场景收集,这是进一步训练autopilot系统的主要手段;
4 道场Dojo系统,是典型的非监督学习系统。被设计为基于海量的道路视频信息进行非监督学习算法(比如聚类),以期能学到结构化的、语义的道路信息,并用于训练autopilot;
5 Karpathy曾经介绍过的基于视觉的自监督学习,主要可以用于视觉信息基础上的深度depth info的推断。这是不需要人工干预的自动化过程;
6 预测功能的实现,也属于自监督学习的范畴(原理是根据历史信息预测未来),具体的预测网络细节如何尚不得知;
7 autopilot系统当中可能存在模仿学习,即强化学习。但如何实现对于数据的筛选和合规化处理,才能定义模仿学习的基准,不得而知。
所有以上所罗列的深度学习方法,多少都有在autopilot系统当中实际落地的线索。只要Tesla庞大的车队持续提供足够的原始视觉信号,以上的各种深度学习就会以不同的速度趋向成熟。
如果很不幸,最终没有趋向成熟,那么小编看不到有第二种方法可以奔向Level-5。大家都做不到。
声明:本文内容及图片由BC-AUTO转载至网络, 信息来源于公众号车右智能。
已完成
数据加载中