马斯克的主要商业版图是汽车与火箭这样的重工业,其实原本与这个时间点的人工智能关系没有那么大。
不过他个人的确是想法极其前沿又激进的一个人,造普通的车可不是他的风格。
特斯拉不仅要带电,还要带自动驾驶!
不仅如此,面对孟繁岐在视觉算法上的接连突破,他有一个大胆的想法。
那就是希望为自己的特斯拉电车产业打造一个纯计算机视觉系统,而不借助其他技术手段。
这是导致他此次再次来寻找孟繁岐,追求技术突破的主要原因。
个人来说,他其实已经对上次的结果非常满意了,只不过他给自己的目标定的太高,想要完成这还远远不够。
自动驾驶在深度学习发展起来之前就已经有了一些不错的成果,不过那些内容都是基于雷达和传感器居多。
主要通过激光雷达或者其他传感器来检测物体,以及这些物体距离车辆的距离。
不过马斯克觉得,这与人类操作车辆的方式不大一样,太不酷了。
想想人类是怎么开车的?
一个人在驾驶汽车的时候,基本上就是纯视觉的,只靠看就能驾驶。车辆上那些镜,主要就是为了方便人看到周围和后面。
可能偶尔有一些听觉的辅助效果,比如鸣笛,不过不是特别关键。主要还是视觉系统在起到作用。
马斯克称之为第一原理思维,他希望做出的智能系统完全按照人类的逻辑去驾驶车辆,而不是借助传感器,毕竟人类可没有这样的超能力。
但是视觉系统完全是基于大量的相机的,非常依赖高精度的检测算法,这就会带来很多的问题。
如果检测到的东西数据集中没有见过怎么办?那还能检测到吗?
基于激光雷达的传感器办法,不管碰到什么,总是可以检测到粒子和物体,它的原理像不像人类不说,至少不那么容易直接撞上去。
纯依靠视觉的智能系统那可就不好说了,必须先用网络处理图像,然后加以分析。
一旦分析出错,出现了误判,那是必撞无疑,肯定会发生车辆事故,一头创死在上面。
马斯克激进的技术策略和喜好导致了一个问题,那就是人工智能算法要做的事情太多了。
想要完全弃用传感器,那四面八方都得安装车载摄像头才行,才能保证前后左右都看得清楚。
此外,还有一个重要的事情,那就是距离的估计。
对于人类来说,根据一张图片去判断其中距离的远近,实在太过容易,可这对人工智能视觉算法来说,不是一件容易的事情。
以现在的技术条件,需要进行非常复杂的标注,去分析样例图片中各个部位和像素的距离远近。
因为图片毕竟是2D平面的,而自动驾驶是一个需要掌握好空间距离的任务。
通过大量不同角度的平面图片,来重构一个三维的空间,甚至鸟瞰视角的三维空间是必要的。
不过现在这还只是空中楼阁,马斯克再次联系孟繁岐的来意非常简单,就是希望这个作为骨干的神经网络可以再快一点,或者计算量再小一点。
否则以目前的情况看,特斯拉很难负担得起这个运算量。
实际上,马斯克没有对这件事情抱有特别大的希望。在他看来,孟繁岐上次给出的方案已经好到非常离谱了。