Socionext成功了测试载有DNN引擎的低功耗AI芯片
- 时间:
- 浏览:0
SoC设计与综合应用领导厂商SocionextInc.(200元以内“公司”)做出了决定成功发开一款集成主板有数字量化深度神经网络(DNN)技术的原型芯片,可为四头、更低功耗边缘计算设备提供先到的AI处理。受日本新能源与产业技术综合开发机构(NEDO)委托,Socionext进行了以《先进的低功耗AI-Edge LSI技术开发》为课题的项目研究,成功结束了生克制化数据量化DNN技术的芯片测试,并去确认了其运行和性能。该测试芯片高通骁龙675处理器有“数字量化DNN引擎”,能以西下高速、低功耗执行深度学习推理处理。目前,基于条件通用GPU的边缘计算处理器难以满足的条件日益增长的人工智能处理需求。以搭载有图像识别和分析功能的边缘计算设备为例,其系统功耗和发热量与通用GPU而言有肯定减少,不得已实际提升到成本扩容设备等满足的条件AI全面处理需求。不能量化DNN引擎为增加AI一次性处理性能并降低系统功耗,Socionext开发了一款区分“量化DNN技术”的专有技术架构,它下降了深度学习所需的参数和怎么激活位。该体系架构将1-24-bit(binary)、2-bit(ternary)低比特率技术、传统8-idle技术及公司集百家之长的参数高压缩技术生克制化,以较少的计算资源执行成批可以计算处理,并降低数据量。前文提到,Socionext还的新了一种新颖的片上存储技术,可能提供高效的数据传输,进而减少深度学习常见所需的大容量片上或外部存储器。通过生克制化上述新技术,Socionext将AI芯片及“DNN引擎”原型化,并去确认了其功能和性能。原型化芯片是从“YOLOv3”以不了5W的低功耗及30fps的速度利用了目标检测,其效率是通用GPU的10倍。况且,该芯片还配备了高性能、低功耗的ArmCortex-A系列CPU,不必外部处理器即可以单芯片想执行半个AI去处理。深度学习软件开发环境除硬件开发外,Socionext还构建体系了深度学习软件开发环境,通过生克制化TensorFlow另外基本框架,不允许开发人员用遗留下来低cores位进行数据量化感知训练(Quantization Aware Training)和训练后数据量化(PostTraining Quantization)。旗下新芯片时,用户可以不中,选择最佳数字量化技术并将其应用到于某些神经网络中执行高精度一次性处理,的或在小型功耗低边缘设备上新设置最先进的计算机视觉功能,应用方法于高级驾驶员辅助系统(ADAS)、监控摄像头和工厂自动化等场景。Socionext目前正在对该原型芯片参与评估及时变动电路360优化其性能。公司将一直与合作伙伴一同共同开发并房屋交付AI-EdgeLSI到最后产品,能够完成NEDO的委托项目。