当前位置:首页 » 自动清洗 » 怎样在自动驾驶方面学习
扩展阅读
深圳整形多少钱 2024-10-13 19:04:49
乐视tv怎样删除软件 2024-10-13 18:55:45
ps怎样做出水雾 2024-10-13 18:27:40

怎样在自动驾驶方面学习

发布时间: 2022-04-19 06:25:28

A. 怎样实现自动驾驶的技术路线

在自动驾驶技术方面,我们可以依靠环境感知、高精度语义地图、数据驱动的驾驶决策和产品级软件实现自动驾驶。

Momenta正是通过这些核心技术,让无人驾驶成为可能。

一、环境感知

道路识别:在黑暗、逆光、恶劣天气和缺乏清晰的车道线的情况下,做到高性能地识别多个车道、交通标志和信号、可行驶区域。

B. 自动驾驶的技术原理包含哪些专业知识

智能驾驶、自动驾驶到无人驾驶是技术层层递进、范围层层缩小的关系。

无人驾驶

汽车在无驾驶员介入的情况下,能在限定环境乃至全部环境下完成全部驾驶任务。

自动驾驶

指汽车至少在某些或者全部具有关键安全件的控制功能方面(如转向、油门、制动),无需驾驶员直接操作即可自动完成。包括无人驾驶以及辅助驾驶。

智能驾驶

包括自动驾驶以及其他辅助驾驶技术,例如语音预警提醒、人机智能交互等,能够在某一环节辅助甚至替代驾驶员,优化驾车体验。

自动驾驶分级标准

SAE(国际汽车工程学会)J3016 文件提出的五级自动驾驶分级方案,是当前被自动驾驶领域与国际社会普遍认可采用的标准。该标准分为五级。

L1、L2 称为辅助驾驶,其汽车驾驶的主体及负责方是驾驶员,自动驾驶系统辅助承担部分驾驶任务。L1 在适用的实际范围内,自动驾驶系统可持续执行横向(如方向盘)或纵向(如油门、刹车)的车辆运动控制的某一子任务(不可同时执行)。L2 中自动驾驶系统可同时执行横向或纵向的车辆运动控制任务。

L3 到 L5 自动驾驶系统可执行全部动态驾驶任务,车辆驾驶的主体及责任方为自动驾驶系统。L3 中驾驶员在有需要时作为备用参与驾驶任务。到 L5,自动驾驶系统承担所有驾驶任务,驾驶员无需参与驾驶。

以上分级场景中 L3 仍有待商榷,是否存在解放双眼却需要驾驶员随时准备参与驾驶任务的场景。就用户角度而言,L3 场景能否做到用户友好。例如当用户在 L3 级别场景下在车内玩手机,而系统突发事件要求用户在 10 秒内接手驾驶操作。就技术角度而言,交通环境中时间即是生命,即使在很短时间内也存在事故发生的可能性。要求系统在 10 秒或更短时间内做出判断与反应,或许已经超出 L3 级别的技术能力。

以上自动驾驶分级标准可以从另一个角度进行理解,如下图所示。L1、L2 解放驾驶员双手双脚,无需操作方向盘、油门等,只需要监视驾驶场景。L3 解放驾驶员双眼,但是要在特殊需要时响应系统需求。在 L4、L5,驾驶员完全无需参与驾驶。

2 企业发展路线不同

根据不同企业的商业模式与其技术优势的不同,不同企业发展自动驾驶技术的定位等级不同,采用的整体技术发展路线也不同。

目前以特斯拉为代表的车企多采用渐进发展路线,利用 L1、L2 自动驾驶技术辅助驾驶员优化驾驶体验。以 Google 等为代表的互联网或高科技企业更多面向 L4、5 方向进行自动驾驶技术的研发工作。

对于互联网等科技企业而言,辅助驾驶技术对算法要求较低,更多以硬件为主,创造的价值不高。因此互联网企业研究 L4 自动驾驶技术,尅占据更多创新技术优势。车企注重硬件基础,从 L1、L2 逐渐起步,逐步提高自动驾驶能力等级,更符合企业发展需求。

另外,不同企业在传感器方案技术路线、决策算法技术路线等的不同选择,即为细分领域技术未定型而导致的分歧,同样基于整体发展策略的大背景。目前发展无人驾驶技术还存在很多挑战。

3 自动驾驶技术原理以及技术大图

不同级别自动驾驶技术的框架是相似的,因其对精度要求、功能覆盖度要求的不同而发展出不同功能。其技术框架核心分为环境感知、决策规划、控制执行三部分,与人类驾驶过程类似。

环境感知

人类驾驶员通过耳朵和眼睛观测环境、了解自己与周围环境中交通参与者的位置与状态。自动驾驶技术的环境感知技术通过感知算法与传感器得到相似信息,包括定位与感知环境。

决策规划

得到环境信息后,通过决策算法和计算平台规划驾驶路径等信息,同时保障安全性。

控制执行

通过控制算法与线控系统控制车辆按照规划的路径执行行驶操作。

如上图所示,上述三部分核心技术涉及到诸多模块。

算法

包括控制算法、定位算法、感知算法与决策算法。就其成熟度而言,控制算法基本可以满足技术要求。就阿里巴巴当前实践而言,定位算法在多数情况下能够满足精度要求。期待感知算法做到精确识别周围环境中物体的类别、位置、运动速度、方向等,目前还存在噪声影响等问题。决策算法需要处理噪声等问题,并且高效地规划出可执行路径。感知算法与决策算法模块作为自动驾驶技术的瓶颈,还有待优化。

传感器

可以根据不同方案、层级选择不同的传感器方案。例如 L2 技术更多使用摄像头与毫米波雷达,L4 技术需要使用激光雷达。激光雷达传感器还存在许多问题,例如稳定性方面的问题。目前主要使用机械的激光雷达,虽然固态激光雷达进展快速,但是实践证明固态激光雷达还不能满足自动驾驶技术的稳定性要求。

计算平台

既需要能力强,又要求低功耗。由于上层算法还未定义好,难以针对性制作或优化出适合算法的芯片。

测试手段

包括真实道路测试、仿真回归测试。仿真回归测试是自动驾驶领域的热门问题,关于如何模拟驾驶环境及驾驶员的真实行为等方面,存在许多技术问题有待突破。

C. 自动驾驶原理

汽车自动驾驶的原理是基于环境感知技术,根据决策规划出目标轨迹,通过侧向控制和纵向控制系统配合,使车辆在行驶过程中能够准确,稳定跟踪目标轨迹,可以实现如速度调整,距离保持,换道和超车等基本操作的。


自动驾驶的原理其实就是让电脑来通过各种摄像头传感器,根据前方的障碍物,然后进行调整。可以实现加速减速,也都是根据路况来确定。

汽车自动驾驶技术包括视频摄像头、雷达传感器以及激光测距器来了解周围的交通状况,并通过一个详尽的地图对前方的道路进行导航。这一切都通过谷歌的数据中心来实现,谷歌的数据中心能处理汽车收集的有关周围地形的大量信息。

就这点而言,自动驾驶汽车相当于谷歌数据中心的遥控汽车或者智能汽车。汽车自动驾驶技术物联网技术应用之一。

驾驶辅助系统(DAS):目的是为驾驶者提供协助,包括提供重要或有益的驾驶相关信息,以及在形势开始变得危急的时候发出明确而简洁的警告。如“车道偏离警告”(LDW)系统等。

部分自动化系统:在驾驶者收到警告却未能及时采取相应行动时能够自动进行干预的系统,如“自动紧急制动”(AEB)系统和“应急车道辅助”(ELA)系统等。

高度自动化系统:能够在或长或短的时间段内代替驾驶者承担操控车辆的职责,但是仍需驾驶者对驾驶活动进行监控的系统。


D. 汽车自动驾驶有地方可以学习吗

汽车自动驾驶,指的是自动档车的学习,这个肯定有地方学习的,只不过比手动档车学习的学费贵。只要考试的科目,肯定有学习培训的地方,就是价格的问题,所以手动档学习的多,自动档学习的少。

E. 自动驾驶汽车的技术原理

汽车自动驾驶技术包括视频摄像头、雷达传感器以及激光测距器来了解周围的交通状况,并通过一个详尽的地图对前方的道路进行导航。这一切都通过谷歌的数据中心来实现,谷歌的数据中心能处理汽车收集的有关周围地形的大量信息。

就这点而言,自动驾驶汽车相当于谷歌数据中心的遥控汽车或者智能汽车。汽车自动驾驶技术物联网技术应用之一。

沃尔沃根据自动化水平的高低区分了四个无人驾驶的阶段:驾驶辅助、部分自动化、高度自动化、完全自动化:

1、驾驶辅助系统(DAS):目的是为驾驶者提供协助,包括提供重要或有益的驾驶相关信息,以及在形势开始变得危急的时候发出明确而简洁的警告。如“车道偏离警告”(LDW)系统等。

2、部分自动化系统:在驾驶者收到警告却未能及时采取相应行动时能够自动进行干预的系统,如“自动紧急制动”(AEB)系统和“应急车道辅助”(ELA)系统等。

3、高度自动化系统:能够在或长或短的时间段内代替驾驶者承担操控车辆的职责,但是仍需驾驶者对驾驶活动进行监控的系统。

4、完全自动化系统:可无人驾驶车辆、允许车内所有乘员从事其他活动且无需进行监控的系统。这种自动化水平允许乘从事计算机工作、休息和睡眠以及其他娱乐等活动。

结构性能

1、激光雷达

车顶的“水桶”形装置是自动驾驶汽车的激光雷达,它能对半径60米的周围环境进行扫描,并将结果以3D地图的方式呈现出来,给予计算机最初步的判断依据。

2、前置摄像头

自动驾驶汽车前置摄像头谷歌在汽车的后视镜附近安置了一个摄像头,用于识别交通信号灯,并在车载电脑的辅助下辨别移动的物体,比如前方车辆、自行车或是行人。

3、左后轮传感器

它通过测定汽车的横向移动来帮助电脑给汽车定位,确定它在马路上的正确位置。

4、前后雷达

后车厢的主控电脑谷歌在无人驾车汽车上分别安装了4个雷达传感器(前方3个,后方1个),用于测量汽车与前(和前置摄像头一同配合测量)后左右各个物体间的距离。

5、主控电脑

自动驾驶汽车最重要的主控电脑被安排在后车厢,这里除了用于运算的电脑外,还有测距信息综合器,这套核心装备将负责汽车的行驶路线、方式的判断和执行。

F. 想要实现自动驾驶技术,需要具备哪些条件

自动驾驶是未来汽车的发展趋势,无论是汽车品牌还是科技科技品牌都在为研发自动驾驶而努力。目前自动驾驶级别分为 0-5 级,而只有 5 级才可以达到完全自动驾驶级别。而现在很多车企在卖车时往往会给出很模糊的宣传,是自己的车辆已经具备了自动驾驶功能, 而这些并不是真正意义上的自动驾驶。

那么真正的自动驾驶首先要具备自动驾驶的功能,而这些功能首先要有硬件作为基础,之后再有处理器、车联网等软件等更强大的数据分析能力、更有逻辑的决策管理程序,那么结合目前的半自动驾驶特点以及市面上一些主流的配置,我们先来了解下实现自动驾驶的几个必要条件。

写在最后:自动驾驶是我们一直所想往的,驾驶员不用再随时精神集中的开着车。但要实现自动驾驶还需要很多的配置,现在车辆的配置、硬件的配置已经可以实现半自动驾驶。在有些细节方面驾驶员并不能信任车辆的该功能,驾驶员应该是占据主导地位。而自动驾驶最重要的就是路网的建设,通过道路和网络整体结合,让车辆与车辆、车辆与行人、车辆与物的数据实时交换,这样车辆的自动驾驶就离我们不远了。

G. AI自动驾驶需要学什么

编程,各种语言,从汇编,到解释型语言 因为适用范围和使用环境不同,都有用到的机会。再细分就太多了比如语文语法,图像,音频,视频 这是基本沟通交流需要,然后就是关于专业了,比如现在有图像识别专业的人工智能(姑且称它为人工智能吧。。...

H. 从自动驾驶突破,理解什么是智能学习

摘要 您好,在自动驾驶这个方面,使用深度增强学习可以有不错的效果。然后再加上一些额外的硬件保障系统,加入地图,IMU等等,那么其效果或许可以媲美激光雷达吧。我感觉Nvidia的做法把自动驾驶弄得一下子不如以前那么高大上了,看CMU和Standford在DARPA上的自动驾驶的车的论文就知道自动驾驶的坑很深。

I. 深度:如何将深度学习和自动驾驶结合在一起

以下是演讲内容的整理:

我是来自于底线线机器人汽车业务的负责人李星宇,地平线机器人成立有一年的时间,创始人余凯是网络深度学习研究院的院长,也算是国内第一个深度学习的研究院是他建立的。他成立了地平线这家公司,专注于深度学习技术的开发,所以在今天我想跟大家分享的主题就是:《如何将深度学习和自动驾驶结合在一起?》。

| 背景:复杂的驾驶环境正是深度学习的机会

应该说在今年的 AlphaGo 和李世石的对决当中,大家对于机器人的关注已经到了一个非常高的水准,其实自动学习已经有不少的时间。今年丰田有做过一个 Demo 的系统,他做了是 8 辆车并没有被教任何的驾驶规则,就是随意往前开,这 8 辆车会置于一个训练系统之下,经过八个小时的训练之后,八个小时下来没有碰撞,这真是了不起的事情。

通过资本界我们来看,这些 10 亿美元的投入都能真金白银地证明整个业界对于深度学习和增强学习技术的看好。

为什么我们需要把这样一个技术运用在自动驾驶领域?千言万语可以归结为一句话就是复杂性。我们看到很多人在很多时候会质疑自动驾驶这件事情,其实他的质疑觉得就是复杂,你可以看到在十字路口,非常复杂的路况。包括中国进入汽车社会不久,驾驶技术有待提高的特殊的国情,变道非常频繁,拐弯很多时候也很暴力。这样一个场景其实对于传统的 ADAS 有很大的挑战性,而这种复杂性恰恰是深度学习的一个优势。

当然很多人也会问,在自动驾驶领域是不是人就没有作用了?我们很长一段时间在自动驾驶领域,人和车的关系其实并不是一个简单的服务与被服务的关系,而是人和马之间的关系。意味着是什么?其实马并不知道在一个大的方向该怎么走,是快一点还是慢一点,这个是需要人来控制和调节。而马能做的就是,无论你告诉还是不告诉,前面是悬崖就会停下来,意味着自动驾驶可以在微观的一个层面,能够把风险降到极低的水平。而在高层次的体验层面,更多的是以跟人配合的关系,它会去理解你。所以在自动驾驶领域很重要的一个话题就是对于驾驶习惯的学习。自动驾驶习惯的学习不仅仅是一个标准的驾驶,还有包括特殊驾驶风格的学习。

这是一个非常标准的美国高速公路管理局的对于自动驾驶的分析。应该说,从我们跟车厂的沟通里面可以看到,现在研发的重点还是基于 Leve13,就是高度的无人驾驶。它的主要不同跟 Leve4 的不同在于,一个就是保证在任何情况下都可以做紧急碰撞的防止,第二个就是在条件良好的道路上部分实现自动驾驶。

从现在实践的情况来看,高速公路上应该不是有太大的问题。现在主要解决的是高速公路上的一些特殊的案例和条件比较好的城区主干上的案例,比如上海的中环、内环、外环的情况下,尤其红绿灯情况下需要一些特殊案例的深度学习。

| 深度学习为什么受到重视?

我们介绍了一个背景之后,稍微回来谈一下深度学习为什么会受到重视。大家现在都觉得 " 深度学习 " 这个词特别火热。

第一个为什么它会受到重视?

应该说深度学习出现的历史其实非常久,最久的历史可以追溯到 50 年代末,在漫长的发展时期里面是几经起伏,有它的高潮的时候也有低谷的时代。从现在的情况来看深度学习最具吸引力的一点就是端到端的学习。

举例,以自动学习的系统去识别一个图片,比如这个图片上是一个人,它会把图片作为输入一个名字,你可以看到人脸的信息量通常是几兆,几百万个字节,最终输出的就是几个字节,就是端到端,可以把非常复杂的非结构化的数字转化为精简数字化的表达,包括语音、语言、图像、视频都是非结构化的,包括金融的交易产生的数据都是非结构化的。

从目前的情况来看,第一个它非常适合大数据时代。在过去的年代,其实大家也是在研究深度学习的算法,那个时候还不叫深度学习,叫深度神经网络。但是发现很难把它调校得好,因为那个时候学的都是一个小量的,几千个样本,想把它调到一个非常好的水准,其实是不可能的。后来大数据出来以后,这个性能就飙升,最终的一个例子就是 2012 年的时候爱莱克斯和他的老师参加了图片分类识别的比赛,一下子从过去的 74% 提高到了 85%,非常大的一个进步。也就是说现在机器对于图片的识别其实是优于人眼,所以实践效果很好。比较通俗的说法,对于这种行为的一种模拟,这种说法可能不是特别的准确,事实上跟它相关联的网络,按它的类似性来说是非常复杂的,而且现在没有搞得特别复杂。

机器学习技术前沿,注意力模型。图片上是对于人脸识别过程的一个描述,如果你抛开技术不看,你直接看,你会看到图象识别的时候,每过一个识别阶段,由很多个识别阶段组成。它的图像的信息会减少一些,最开始会把图像的彩色性去掉,只留下一个归录信息。

第二步会把规录中间的去掉,只留下边缘线条的信息,然后线条会变成点,这是从低位空间向高位空间不断的扭曲的过程,到最后它的图片信息就会精简到一个字母,所以这就叫多层的卷积神经网络。大家都知道这样一个复杂的关系势必会带来数据极大的产生,因为肯定需要非常大的参数。

自动学习技术也在不断地往前推进,我们现在看到各个领域都全面推进。

比如注意力模型,什么叫注意力模型呢?举例,在鸡尾酒酒会上看到很多的人,但是你只跟其中一个或者几个人谈,这个时候你的听觉系统只会注意到你想关注到的那个人的话,而把其他人的给屏蔽掉。解决了在复杂的语义环境下,会对特别的语音进行聚焦。当我们对这个妇女说,我要求你把飞盘作为聚焦目标的时候,机器系统可以把飞盘反射出来,也就证明它准确能够聚焦到你想要它聚焦的部分,这个是非常关键的,因为这个系统是非常复杂的,而你只需要自动驾驶的系统关注车辆、车道线、人这些关键的信息,这样一个技术可以使得它很有效的处理。

除了注意力模型以外还有其他的进展,包括长时短时的记忆力模型,这个是做什么用?它会使深度学习,不仅仅是在空间,二维平面上有足够的学习,它能记住过去发生的事情。刚才丰田的小车的 Demo 里面可以看到,它对瞬间场景的处理做得很好,但是有没有想过如果场景的处理手法依赖于过去的历史怎么办?比如我们把魔兽和星际争霸,下一步的动作取决于你的历史状态,这个时候要求你的深度神经网络需要足够的记忆力,能够记住过去的状态,这个记忆力模型就是解决这个问题包括序列化等等。

增强学习

什么是增强学习?

打一个比较形象的比方,如果过去的系统我们当做是计划经济的话,那么增强学习就是市场经济,可以理解它是一种结果导向的技术。准确描述这是一个智能主体跟环境不断博弈而来优化的一个过程。比如刚才的丰田的小车是一个增强学习的典型的案例,如果它碰撞了给它惩罚,如果没有碰撞给它奖励,多轮的循环会加强这些行为,达到一个期待值。深度学习可以用来做环境的感知,而增强学习可以用来做控制的东西,这样就可以构成一个完整的自动驾驶系统。

这是一个非常典型的汽车的自动驾驶系统的框架图,在图像的左侧有各种各样的传感输入,这个数据来源于三个,汽车外围的环境数据,汽车本身的状态数据,比如车速、转向,还有车内人的数据,是不是疲劳驾驶,是不是要转弯。一个是感知的融合,一个是决策。

|深度学习让自动驾驶从感知到控制

深度学习在中间的感知和决策都是有非常大的优势,可以进一步把这个事情分解一下。

我们跟过内的主机厂接触,由于现在国内有一些主机厂已经开始比较深的自动驾驶的研发,去讨论大量的细节。我们可以简单把它划分成这样的一个板块,就是态势感知和决策控制。

态势感知和决策控制

态势感知一部分就是对外的态势,就是你要对整个的环境要有感知,对内就是对驾驶员的意要图要有感制,包括意图的判断。包括对外部物理的辨识,哪些是固定障碍物,哪些是栏杆,哪些是可行驶区域。对于驾驶,包括状态的识别其实非常重要。这也是整个自动驾驶业界流派之争的一个焦点。

以谷歌为代表的,他们想做的是全自动驾驶,但是我们还是要一步一步来,这面临有一个半自动驾驶的过程,谷歌觉得很难做到很好的人工和自动驾驶的切换,没有办法把这件事情做得特别的可靠。

其实这个我认为要这样来看,首先主机厂其实是一定会按照循序渐进的过程来走,因为他们是造车的。第二个在这件事情上深度学习可以很好地帮助缓解这个问题。我们不能说一定能全部解决,至少能够极大地缓解这件事情。因为深度学习对于驾驶员状态的综合理解比其他的手段要来得更好,因为它是基于大量对于驾驶员技术分析的基础上建立对它的一个综合理解,包括他的驾驶习惯、意图等。

决策控制包括几个部分。就是对于车辆来讲有一个局部的运动路径的规划,另外规划里面还有一个驾驶风格的情况,比如需要运动感强一点的,都不一样。最后一个是执行器控制,状态之间形成一个闭环去调校。

应该说在现在有很多初创的公司,包括像英伟达这样的公司做大量的尝试,如何把整个的系统用深度学习的方法进行优化。英伟达做得比较暴力,直接忽略了中间的决策这一部分,是直接把传感器的输入和车的状态的输入直接关联,做这样一个预测。也就是说 Y 就是执行器刹车、油门、转向,输入就是车的信息、环境的信息,非常暴力,不做任何中间人工智能的分析。

自动驾驶还有一个非常重要的点,就是如何进行测试。

整个自动驾驶来讲主要的投入还是在测试这块,并不是做一套软件系统就可以了。特斯拉做得很讨巧,直接在量产上进行测试,所以短时间内积累了超过 1.76 亿英里的速度。但是还是需要一个模拟系统去做这件事情,有一个模拟系统,如何在模拟系统各个主体能够真实的模拟,这其实也是一个增强学习可以帮助你的。

当你创造了一个虚拟环境的时候,你希望用多台的计算设备去模拟一个目标,模拟几十个人,模拟路牌等等,每一个都是动态的过程,它们不地变。比如红绿灯会不断地变,车辆动态的变化,这样一个复杂的结构,其实很适合于深度学习和增强学习来做,包括结合模拟。

在这个方面德国的车厂宝马和奥迪走得比较靠前,当然包括丰田其实也是一样,做大量的工作,这个是奥迪的汽车大脑的构架图,AUDI 的 zFAS。zFAS 系统模块配备了 Mobileye 的 EyeQ3 移动处理器以及英伟达 TegraK1 芯片。奥迪的观念非常清晰,自动驾驶的关键还在学习。

地平线在这块领域也是进行了大量的工作,我们有一个品牌叫做雨果,这是汽车的一个开放平台。

(播放视频)这个是雨果做的整个道路的语义理解,它可以把道路各个不同种类的物体运用不同色彩标识出来,比如栅栏是红色,道路是绿色,树木是深绿,汽车是紫色,这样一个对于道路综合语义理解对于智能驾驶系统是很关键的,很多道路也不是结构化的道路,比如乡村的道路其实没有车道线,栅栏也没有,你没有办法通过车道线去自动驾驶,这个时候你要自己去决定该走哪一块。

这是地平线做的识别,左上角是英伟达的,很遗憾不能秀一下动态的视频。地平线是在北京做的测试,在这个路口的人其实非常的密集,地平线很好做了识别,并且对于出租车里面的人,仅仅露一个脑袋的人也可以识别。

对于车辆检测,地平线从去年 8 月开始,长期保持在 KITTI 排名第一的识别率。Densebox 就是测试的名字。

地平线是一家专注于算法和芯片开发的公司,我们在最下端的解决方案,我们更多愿意跟业界合作伙伴,各类的公司和主机厂一起合作,一起做最后的产品出来。地平线的算法团队其实蛮国际化的,助力的算法团队来自于像 facebook、网络、中科院。我认为在深度学习领域,我们中国第一次有机会基本上跟国际的主流的开发的机构处于差不多的一个水平线上,不能说是绝对的齐平,但是不会有太大的差别。

| 我们为什么要自己做深度学习的芯片?

刚才赵总也分享了,为什么我们需要深度学习的芯片,提到很多国内公司在宣称自己在做这个,这是一件好事,因为大家都知道现在的计算结构不合理。

比如说举一个例子,深度学习的输入是高度密集化的,这种密集化输入不太适合 DSP 这种,是流水线的,GPU 的一个问题在哪里?

在多输入之后的下一步处理,在数据缓冲方面做得不好。很不幸的是深度学习网络它的输入是前后关联的,在中间隐藏层的时候,这个卷积盒是要跟前置进行卷积计算的,这就意味着首先要取参数、计算,这就会导致在正常的一般结构下会大量的有外出效应。

第二个因为带宽永远是有限的。

第三个是功耗问题,这些都是非常实际的问题。

还有一点就是,深度神经网络的参数非常多.

整个业界都意识到,如果要在深度学习领域能够做的话,像地平线得自己做芯片有点类似于手机业界,在大约十年前的时候,手机业界还没有一个想法说一定要做自己的芯片,但是今天大家已经看得非常清楚,如果要想做起来必须做自己的芯片,苹果、三星、华为都是自己的,如果你不这么做只是使用高通的平台,你还是可以做,但是很不幸你是第二梯队。所以在深度学习也是一样,你还可以用英伟达、高通的芯片,可是这不是第二名和第一名的差距,这是第二梯队和第一梯队的差距。因为算法在演进,你如果用别人的话肯定是慢一拍的,这是一个问题。

国内有不少公司在做,包括有一家公司叫做(深建科技),最近他们发表了成绩,就是 DPU,深度学习的处理器,他们在单位功耗下的性能表现是英特尔之前 CPU 的 24000 倍,是英伟达 GPU 的 3000 倍。而他们所做的优化的工作,恰恰是刚才我提到的问题,对于压缩,对于访问的优化,降低了功耗。

地平线也是一样,我们非常清晰认识到这个问题,所以我们的做法也是这样,我们地平线也是在做自己的芯片。我们希望在短时间内能够把整个的能耗比提升千倍。

地平线现在专注的深度学习的技术的应用点有哪些?四个大块,语音、语言、视觉、控制。应该说,这四个纬度可以构成大量的创新的应用,不仅仅是自动驾驶,还包括家庭的服务器的监控等等。我们的目标是希望在未来,我们可以用我们自己的算法芯片,跟广大下游的伙伴进行合作,比如空调公司,比如扫地机器人公司等等,能够覆盖超过 1000 个品类的智能产品,我们的目标是为现代的智能硬件真正的赋予智能,所以我们的目标是定义物联网时代的大脑。

我的分享就到这里,我们也是非常欢迎大家如果有意跟地平线合作,我们提供平台解决方案,而不是某个具体品类和最终的产品,谢谢大家。

J. 汽车自动驾驶如何实现

目前实现自动驾驶主要依靠“感知-决策-执行”的方式。
其中,感知系统也称为“中层控制系统”,负责感知周围的环境,并进行识别和分析;决策系统也称为“上层控制系统”,负责路径规划和导航;执行系统又称为“底层控制系统”,负责汽车的加速、刹车和转向。
这些系统的背后,人工智能技术也提供了重要的支持。
以深度学习为代表的计算机视觉技术,可以满足视觉感知高精度的需求,提高自动驾驶汽车面对复杂交通环境时的决策能力;前期决策树、贝叶斯网络为自动驾驶行为决策与路径规划提供了重要的技术支持;神经网络控制则在车辆控制方面提供了重要的技术支持。