yaboPP电子
消息

数字大小的模拟功率?Edge AI处理器结合了两个世界的优点

12月02日,2020年12月经过杰克赫兹

模拟计算能否成为解决边缘人工智能硬件面临的诸多挑战的可行方案?我们采访了Mythic的首席执行官Mike Henry,看看他们为什么这么认为。

传统的处理架构并不能将人工智能带向尖端。典型的von neumann架构而AI不良好,因为内存中的大量数据移动,以及高时钟速度,不利于低功耗,高性能AI处理。很多公司都有转向内存计算为解决方案,但问题仍然存在。

数据从内存移动到处理器的移动

将数据从内存移动到处理器所消耗的能量是计算本身的200倍。这对人工智能硬件构成了严峻的挑战。从图片冯石等。

AI加速公司神话采用了一种新的方法来解决这些问题:用模拟计算替换数字计算。我们采访了Mythic的首席执行官Mike Henry,以获取最新产品,M1108的详细信息,以及它们如何使用模拟计算将AI带到边缘。

具有类似数字足迹的模拟性能

模拟计算机可能听起来很陈旧,但事实证明,它们在传统的数字计算方面提供了很多好处。最为显着地,与数字计算机相比,模拟计算有潜力提供巨大的功率和性能节省.然而,模拟计算主要受到模拟内存元素历史上非常大的事实的限制,最终限制了速度和可伸缩性。

M1108

M1108。图像使用的是神话礼貌

寻求利用模拟计算的好处,同时踩踏内存问题,Mythic联合嵌入式闪存,模拟计算。

“现在我们拥有所有世界上最好的,”首席执行官迈克亨利评论。“我们得到了几十年所知的模拟计算的力量和性能。我们拥有闪存的存储和计算密度。这是Mythic在多年来建造的核心创新。”

结合模拟计算和闪存

Mythic将其最新产品,M1108,该行业的第一个AI模拟矩阵处理器(AMP)

如前所述,该系统的工作原理是将真正的模拟内存计算与闪存的高内存密度相结合,提供8位片上内存。

该芯片利用Mythic AMP,这是一个由112“瓷砖的数组组成的数据流架构。每个图块包含模拟计算引擎,数字SIMD矢量引擎,32位RISC-V纳米处理器,NOC路由器和本地SRAM。不需要外部DRAM。

神话的瓷砖建筑

神话的瓷砖建筑。图像使用的是神话礼貌

“传统上,原始向量矩阵计算是在模拟域进行的。其他的一切都在数字领域处理,”亨利解释道。“我们将两者融合在一起,这是我们在过去8年里不断完善的东西。”

平铺系统还提供了神话,能够非常容易地扩展或下降。蒂姆车辆,在神话中的产品和业务发展的SVP说:“缩放对我们来说很容易。如果我们想要运行更大的型号或更多型号,我们可以在PCI Express卡上添加更多芯片。如果我们想做一个较小的版本,我们可以做一个4 x 4阵列的瓷砖或3 x 3阵列的瓷砖。“

他补充一下,“有些方法可以通过添加筹码以向上时尚或缩小瓷砖的数量来击中较小的价格点和大小的方法来完成这款产品。”

Mythic的M1108:AI模拟在动作中计算

以这种方式合并模拟和数字域已经产生了一种产品,可在显着更小的功率,更小的尺寸和更低的成本下提供数据中心性能。

该芯片基于40nm CMOS工艺技术,支持INT4、INT8和INT16操作,同时还能够完全在芯片上运行单个或多个复杂的dnn,重量可达1.13亿。

神话M1108 vs. NVIDIA Xavier AGX

Mythic M1108与NVIDIA Xavier AGX。图像使用的是神话礼貌

在最高帧率下运行ResNet-50, M1108的峰值达到35 TOPS,每秒870帧,功耗仅为4 W。与NVIDIA的Xavier AGX相比,M1108表现出更好的性能、更低的功耗、更小的面积和更便宜的价格。

Edge Ai的模拟计算在这里

虽然模拟计算可能似乎已经过时,但Mythic声称已恢复它并用新的模拟矩阵处理器恢复它的全部潜力。将模拟计算与闪存相结合,该设备演示了一些令人印象深刻的规格,甚至与NVIDIA这样的数据中心Powershouses相比。

具有高性能,低功耗,低区域和高度可扩展的架构,Mythic的新M1108似乎很准备满足高端边缘AI应用的性能和价格挑战,如监控摄像机和视觉系统。在M1108上,亨利乐观报道,“这就是我们如何达到AI的承诺。”

Vehling补充说:“这可能是工程师们第一次真正能够利用模拟计算的能力。它就在这里,它到达了,它运行得很好。”