科技网

当前位置: 首页 >数码

Otureo做了个加速引擎一部手机就可以

来源: 作者: 2018-09-29 10:03:42

Otureo做了个“加速引擎”,一部就可以玩转“深度学习”

以深度学习算法为代表的人工智能(Artificial Intelligence,简称AI)技术正在计算机视觉、自然语言处理等诸多领域飞速发展,这些成果逐渐被应用到日常生活中,改变着人们的生活方式。作为与人们日常生活最为密切相关的也是应用作为广泛的消费类电子设备,智能如果能够实现对深度学习的承载,将会把人工智能的应用真真切切地落地至每个人的身边。那么,智能如何才能够实现对深度学习的承载呢?

如果仅仅是将智能作为数据获取和结果呈现的终端,那么其深度学习算法的运算过程依然部署于云端设备,例如当今已然成熟的语音识别及输入功能就是基于这样的方式实现。当面对更大数据量传输需求的实时性图像类智能应用场景时,这类云端部署的方式将会不可避免地受限于固有的传输延迟等问题;同时作为个人化的电子终端,数据的私密性与安全性也是重要的应用考量因素。因此,完全依赖终端实现深度学习的部署,是许多应用场景所提出的刚性需求。

如何满足这样的需求,其实并不是一件轻松的事情。深度学习算法通常基于大规模多层神经络,在络的每一层上,输入数据通过一系列计算变换产生相应的输出结果。上述大规模多层神经络往往包含海量的计算变换操作,对于所依托硬件设备的计算能力提出了相当程度的要求。然而,以智能为代表的消费级终端设备所依托的均为嵌入式平台,与服务器或PC(个人计算机)平台相比,其架构差别明显同时计算能力和访存带宽存在着天然的局限;并且,当前主流的深度学习框架几乎均为针对服务器或者PC平台而设计的,无法直接适用于嵌入式平台。由此看来,真要是在一部小小的智能上玩转起来深度学习,还真是颇有挑战,需要多管齐下各种技术手段,下一通深功夫才行。

作为一家专注于人工智能加速技术的科技企业,Otureo(泓图睿语)由三位清华大学校友共同创立于2015年底,当前总部位于北京中关村并已在加州(美国)硅谷设立办公区。主要业务为面向各类嵌入式终端设备与应用,提供针对深度学习的加速技术以及相关产品,通过自上而下多重层次的加速技术,调和解决深度学习所需的大运算量与嵌入式终端设备有限的计算能力之间的固有矛盾。

为了实现只用一部就玩转深度学习这个小目标,Otureo新近发布了一项服务于终端的平台化加速技术解决方案。该方案集合了粗粒度并行、内联式汇编和SIMD细粒度并行加速等多重技术,基于ARM-v8处理器这一平台,针对诸类典型的卷积神经络实施深度优化,使得整个卷积神经络经过加速后的整体性能得到了显著提升。如下图所示,在多个不同配置的卷积层(深度学习络中耗时最长的部分)计算中,这项最新的加速技术取得了平均2.5倍的加速效果;在relu激活函数的计算上则达到了2.3倍的加速效果;即便是在加速效果相对偏低的全连接层上也取有平均1.6倍的加速表现。对于多个深度学习络,总体络性能平均加速效果在2倍左右。

这一解决方案产品的商业意义在于面向设备厂商提供了一个可以内置于嵌入式系统底层的平台式加速引擎,可以支撑更多的深度学习算法以及应用功能突破现有的硬件资源瓶颈从而被成功地引入到终端,强力驱动人工智能的丰富应用在终端落地。受益于此,诸多前所未有的、新鲜奇妙的应用体验将会越来越贴近人们的日常生活,同时也会成为各家厂商在人工智能时代的独特功能卖点。

这一次在上开始玩转深度学习之前

Otureo做了个加速引擎一部手机就可以

,Otureo自创立以来已经在应用于消费类终端电子设备的加速技术方面逐步建立了深厚而扎实的积累,相关技术产品已经在消费类无人机、家用机器人等终端产品领域获得商业应用。这一次,专为深度学习而生的加速引擎被Otureo玩转到了里,我们拭目以待!

相关推荐