新智元报导
来历:venture beat
修改:雅新
【新智元导读】本周,IBM宣称,其神经核算机体系到达了每秒120万帧的练习时刻,创下了最新记载。IBM在AI模型练习上完成了大打破,可与最先进的技能相匹敌。网友对此表明几乎不敢相信!
在今年年初宣布的一篇论文论文中,IBM具体的介绍了神经核算机。这是一种可从头装备的并行处理体系,旨在研讨和开发新式的AI算法和核算神经科学。
就在本周,该公司在神经核算机上演示了第一个运用程序:一种深度的神经进化体系。该体系将Atari 2600的硬件完成,图画预处理和AI算法结合在优化的流水线中。
试验报告得出的成果可与最先进的技能相匹敌,但更重要的是,IBM宣称该体系到达了每秒120万帧的练习时刻,创下了最新记载。
网友惊呼,「几乎不敢相信!」
神经核算机就像是在AI核算军备竞赛中宣布的一个示警信号。
据OpenAI发布的一项剖析显现,从2012年到2018年,规划最大的AI练习运转中运用的核算量增长了300,000倍,是3.5个月的两倍,远远超过了摩尔定律的脚步。
AlexNet到AlphaGo零:核算量增长了300,000倍
先来了解一下IBM 的神经核算机吧
IBM神经核算机
IBM的神经核算机由432个节点组成(每16个模块卡中有27个节点),这些节点是IBM长时刻战略合作伙伴Xilinx的现场可编程门阵列(FPGA,规划用于制作后装备的集成电路)。
IBM神经核算机每个模块卡中有27个节点
每个节点均有一个Xilinx Zynq单片体系(一个双核ARM A9处理器与一个FPGA在同一芯片上配对)以及1GB专用RAM芯片。
节点以3D网格拓扑结构摆放,并与电气衔接(称为穿硅通孔,这些通孔能够彻底穿过硅晶圆或芯片)笔直互连。
在3D网格拓扑结构中能够正常的看到节点数字
在联网方面,FPGA供给模块卡之间物理通讯的拜访,以便树立多个不同的通讯通道。
理论上讲,单个卡能够支撑高达每秒432GB的传输速度,而神经核算机的网络接口能够本身调理并逐渐优化, 使其匹配给定的程序。
在论文中具体简述了神经核算机结构的一起作者写道,「咱们体系的共同之处在于每个节点答应特定运用的处理器卸载,这一功用在咱们所知任何规划的并行核算机上均不可用。大都功用的关键过程已在FPGA上卸载和优化,一起ARM处理器供给了辅佐支撑。」
已然对神经核算机有所了解,那么IBM在神经核算机上的初次运用演示,体系是怎样到达创纪录的每秒120万帧的练习时刻呢?
咱们来一探终究
用Atari游戏测验AI
用电子游戏来做测验,是AI和机器学习研讨最好的渠道。
它们不光能够随时拿来进行测验,并且大规划运转成本低。
比如在强化学习等特定领域中,为了获取奖赏,AI经过与环境互动来学习最佳行为,游戏分数就是最直接的奖赏。
游戏中开发的AI算法已体现出出可习惯更实践的用处,例如蛋白质折叠猜测研讨。假如IBM神经核算机测验成果是重复的,则该体系能够用于加快这些AI算法的开发。
研讨人员在神经核算机中每个卡运用了26个节点,对一共416个节点进行了试验。
Atari游戏运用程序的两个实例都是在416个FPGA中每个节点上运转,最多可扩展到832个节点并行运转的实例。
每个实例都从给定的Atari 2600游戏中提取帧,履行图画预处理,经过机器学习模型运转图画,并在游戏中履行操作。
运用深度神经在FPGAs练习游戏的截图
为了取得最高的功用,研讨团队防止仿真Atari 2600,而是挑选运用FPGA在更高的频率下完成控制台的功用。
他们采用了开源MiSTer项目的结构,该项目旨在运用现代硬件从头创立控制台和街机,并将Atari 2600的处理器时钟频率从3.58 MHz提高到150 MHz,每秒发生约2514帧。
在图画预处理过程中,IBM的运用程序将帧从五颜六色转换为灰色,消除了闪耀,将图画从头缩放为较小的分辨率,然后将帧堆叠为四组。
然后将它们传递到推理游戏环境的AI模型和一个子模块,该子模块经过辨认AI模型猜测的最大奖赏来挑选下一帧的动作。
在五个试验过程中,IBM研讨人员在神经核算机上运转了59个Atari 2600游戏。
成果表明,与其他强化学习技能比较,该办法的数据功率不高,一共需求60亿个游戏结构,但在Montezuma的Revenge and Pitfall等具有挑战性、探索性的游戏中失利了。
在59个游戏中有30场胜出,Deep Q-network花了10天进行练习,而IBM团队只用了6分钟来练习(2亿个练习帧)
在神经核算机上运转的59个Atari 2600游戏有60亿个练习帧,在36场竞赛中超过了Deep Q-network,而练习时刻减少了2个数量级(2小时30分钟)。
参阅链接:
https://venturebeat.com/2020/05/14/ibm-claims-its-neural-computer-achieves-record-ai-model-training-time/
https://arxiv.org/pdf/2003.11178.pdf
https://arxiv.org/pdf/2005.04536.pdf