AI时代的MCU,将走向何方?
点击:397次 发布时间:2021-08-10 数据来源:东莞艾迪科
今年上半年, ARM发布了针对MCU场景的首款microNPU Ethos U55系列。该microNPU主打超低功耗,根据用户需求可以搭载32-256个MAC(乘法累加器)单元,最高可以提供0.5TOPS的算力。ARM给Ethos U55搭配的处理器是高端Cortex M系列处理器(例如Cortex M55),可见在当时Ethos U55设计的初衷就是赋能中高端MCU市场。在过了半年多时间之后,ARM在最近又发布了Ethos U65系列,作为Ethos U55的升级版本。Ethos U65是ARM和主要合作方NXP一起定义和设计,相对于Ethos U55的主要区别在于Ethos U65中的MAC单元数量从原来的最多256增加到了512,从而将最大的算力从0.5TOPS提升到了1TOPS。此外,在NXP的系统设计中,整体系统中除了Ethos U65除了搭配Cortex M之外,还配上了一个Cortex A系列处理器。我们认为,ARM在一年中连续发布两代针对MCU的microNPU,一方面说明了MCU市场对于AI和AI加速器确实有很强的需求,而另一方面,我们也看到了随着智能家居等新品类的出现和流行,MCU和APU之间的间隔正在缩小,这也将为未来的智能MCU生态带来新的变化。在2017年之后,智能MCU慢慢进入了大众的视野。例如,在2017年意法发布了Project Orlando作为实验性质的MCU超低功耗AI加速器单元,而瑞萨也在2018年发布了针对MCU的可编程可重构协处理器DRP。在经过了三年发展之后,我们认为在MCU中加入AI加速器正在变得越来越主流,而且在需要AI相关算力的应用中,使用专用AI加速器的收益往往大于加强处理器性能。从应用的角度来说,AI加速器搭配MCU更加主流的主要原因是需要AI的场景越来越普遍,而且从具体的算法和模型来看正在收敛到少数几个模型,例如机器视觉(人脸识别,物体识别)和语音唤醒词中需要的卷积神经网络,以及在一些较为先进的语音识别中需要的循环神经网络(RNN)。如果说在三年前,未来AI算法和应用生态前景还不够明确,因此会出现走专用化(AI加速器)和通用化(加强处理器性能以及可编程协处理器)两条道路的话,那么在应用和相关算法都已经很集中的今天,AI加速器已经成为较为明确的选择了,因为一方面使用专用化的AI加速器可以提供最佳的性能和能效比,而且另一方面在芯片设计门槛上事实上也并不太高,事实上更考验设计能力的反而是编译器和相关的软件/模型优化。因此,我们认为在未来会有更多智能MCU相关的产品和解决方案出现。我们观察到的另一个趋势是MCU和APU,至少在一些热门的场景中(例如智能家电),正在走向融合以组成新的系统。在过去的家用电器中,MCU是常见的元件,它主要用于家用电器的控制,并且能执行一些简单的预定义程序。上一代家用电器中,需要用到计算的场景几乎没有,所以MCU除了控制之外,并不需要负责计算。而在上一代的MCU和APU的分工定位中,MCU通常意味着低功耗,低成本,低处理能力;而APU则代表着高性能,高成本以及高功耗。在对于成本需求较高的家电领域,使用高成本APU的机会很少。而在这一代的智能家电中,随着AI的普及,对于计算的要求越来越高,这也是MCU越来越多搭配AI加速器的原因。除此之外,“智能化”的另一个涵义通常是能和人做交互,因此在这些智能家电中,往往还需要跑一个操作系统,这样的需求就会需要一个类似APU的核来完成。在这样的需求下,使用APU搭配能处理AI算力的MCU就是一个合理的选择。这里的MCU不再是传统上用于watchdog的APU周边设备,而是一个能以高能效比处理大量实际任务的重要模块。举例来说,在需要声控唤醒的智能设备中,就可以采用这样的方案:高功耗的APU绝大多数时候处于深度睡眠状态,同时带有AI处理能力的低功耗MCU则处于监听状态,当MCU上以低功耗运行的AI加速器检测到唤醒词时,MCU负责唤醒APU,同时APU则执行更复杂的语音识别算法并且完成相应的操作,例如播放音乐,或者语音通话等等。在这样的一个系统中,智能MCU和APU各负其责,由于绝大多数时间APU处于深度睡眠状态,因此整体功耗可以控制到较低的水准;同时,我们看到MCU需要监听环境,执行AI算法并且在需要的时候准备唤醒APU,因此MCU中的高能效比AI处理能力就成了关键。此外,另一个推动APU+智能MCU方案的因素是智能家居对于成本的需求不再那么苛刻。一方面,不少消费者愿意为智能家居中的AI能力付相应的溢价;另一方面,许多智能家居的背后有着互联网巨头的加持,智能家居更多是一个使用互联网巨头相应服务的一个入口,因此相对于成本互联网公司更关心的是智能家居能实现的功能特性。因此,智能家居对于成本的要求不再像上一代家用电器那么苛刻,从而APU+智能MCU的方案也会得到更多的应用。智能MCU未来的市场生态,我们认为可以从多个维度去分析。首先是RISC-V和ARM之间的竞争格局。从智能MCU的技术生态方面做分析,我们认为RISC-V在这个智能领域并没有特别的优势。如前所述,智能MCU的主流技术路径是MCU搭配AI加速器,而AI加速器的设计通常和处理器指令集(即使用ARM还是RISC-V)关系不大。另一方面,AI加速器中事实上软件编译器是一个重要难点,而这一方面拥有较大团队和时间投入的ARM显然更有优势一些。另一方面,RISC-V在这个领域的使用往往是考虑到可定制性和可控知识产权,因此我们认为更有可能是一些对于深度定制产品的大公司有更大的动力去使用RISC-V来实现芯片-软件-产品协同设计。一个典型的例子就是阿里巴巴对于RISC-V的大力投入,我们认为未来中国基于RISC-V的智能MCU很可能会首先在阿里巴巴的物联网和智能家居产品中成为主力。其次,我们还可以分析智能MCU中AI加速器方案的生态。目前,除了以ARM的microNPU为代表的AI加速器之外,还有以Cadence HiFi系列为代表的的DSP也在积极布局这个市场。DSP在这个市场的主要优势在于语音相关的AI应用,因为DSP技术在音频相关应用已经有了几十年的积累,因此在加入神经网络支持后就可以覆盖语音相关的AI场景,而目前我们看到的是智能语音占领了智能MCU中很大的一块市场需求,这也为DSP方案提供了很强的支撑。而在以机器视觉为主的方案中,一个专门为卷积神经网络做优化的AI加速模块目前来从性能和能效比还是会更强一些。
最后,我们还看到了许多以低功耗为主打的AI芯片公司也在积极布局这个市场,例如能实现微瓦级别机器视觉任务加速的识时科技等。以传统公司立足MCU并加入AI加速模块赋予MCU以智能不同,AI芯片公司对于这个市场的打法是基于自己的AI处理器方案,搭配一个MCU来实现智能MCU。这样的方案更适合对于人工智能处理有极致需求的场景(比如需要超低功耗超高能效比的AI处理能力,类似智能门锁等),因此随着未来AI应用场景进一步下沉,我们预计会看到会有越来越多的AI芯片公司进入这个市场。
深圳市卓精微智能机器人设备有限公司成立于2010年,是一家专业研究IC(集成电路)的烧录、功能测试、物料、标识、包装转换以及CCD来料检查等技术的高科技企业。公司拥有多项国家级软件和技术专利类自主知识产权,拥有一批由博士后、博士、硕士组成的专家级技术团队,公司自主经营、自主品牌,是国内IC烧录/测试智能设备行业的领军型企业。
下一篇:2020年1
[ 2021-07-26 00:00 ]