开云「中国」Kaiyun·官方网站-登录入口

开云「中国」Kaiyun·官方网站-登录入口

开云体育应用于仿生尖峰神经会聚模子时-开云「中国」Kaiyun·官方网站-登录入口

Hala Point系统集群(图片来源:英特尔)Hala Point系统集群(图片来源:英特尔)

东谈主工智能(AI)界限迎来要紧事件。

北京时辰4月18日凌晨,好意思国芯片巨头英特尔(Intel)文书,其打造出大家最大的神经拟态系统——Hala Point,旨在提拔昔日类脑 AI 接洽,以及搞定 AI 当今在着力和可握续性等方面的挑战。

Hala Point内置1152个、基于Intel 4(7nm)制程的英特尔Loihi 2处理器,提拔多达11.5亿个神经元和1280亿个突触,每秒可处理越过380万亿个8位突触和越过 240 万亿个神经元操作,关系系统开始部署在好意思国桑迪亚国度本质室。应用于仿生尖峰神经会聚模子时,在运转神经元数目较低的情况下,Hala Point速率可比东谈主脑快200倍(20000%)。

英特尔接洽院神经拟态缱绻本质室总监Mike Davies暗示:“当今,AI模子的算力本钱正在以弗成握续的速率上涨。行业需要大略限度化的全新缱绻纪律。为此,英特尔斥地了Hala Point,将高着力的深度学习和新颖的类脑握续学习、优化智力结合起来。咱们但愿使用Hala Point的接洽大略在大限度AI时间的着力和符合性上赢得打破。”

事实上,所谓神经拟态芯片,是一种模拟生物神经元的芯片。

与肤浅芯片不同的是,神经拟态芯片的缱绻任务是由好多小单位进行的,单位之间通过一样生物神经的尖峰信号相互通讯,并通过尖峰调养其行动。

早在2018年,基于英特尔接洽院的先进时间接洽,英特尔推出了首款神经拟态芯片Loihi,继承14nm制程,可应用于机器感觉等场景。

2021年,Loihi系列全面升级,英特尔发布了第二代神经拟态芯片Loihi 2,继承英特尔第一个EUV工艺节点Intel 4,芯片等效于4nm,实质为7nm工艺。

Loihi 2共有128个神经拟态中枢,这128个内核每一个王人有192KB的天真内存,每个神经元不错说明模子分拨多达4096个气象,而之前的限度惟有24个。

与肤浅的CPU和GPU不同,神经拟态莫得外部内存。每个神经元王人有一小部天职存供其专用。主要作用是分拨给不同神经元输入的权重、最近看成的缓存以及峰值发送到的统统其他神经元的列表。Loihi 2不错说明用途选拔各式不同勾通选项,这少量上有些一样于FPGA。

英特尔强调,在实施AI推理负载和处理优化问题时,Loihi 2神经拟态芯片系统的速率比通例CPU和GPU架构快50倍,同期能耗裁汰100倍。

除了硬件家具外,英特尔还发布了用于Loihi芯片的软件,一个名为Lava的新斥地框架。该框架以及关系库王人用Python编写,并在GitHub上开源,斥地东谈主员无需探望硬件即可为Loihi斥地智商。

如今,英特尔也曾将Loihi 2芯片用于机械臂、神经拟态皮肤、机器感觉等场景。英特尔暗示,Loihi 2应用了繁多类脑缱绻旨趣,如异步(asynchronous)、基于事件的脉冲神经会聚(SNNs)、存算一体,以及束缚变化的阑珊勾通,以完了能效比和性能的数目级升迁。神经元之间大略告成通讯,而非通过内存通讯,因此能裁汰合座功耗。

英特尔Hala Point神经拟态系统接洽团队

而在新一轮 AI 时间引颈下,4月17日,英特尔将这个神经拟态芯片进行“暴力拼装”,构建了大家最大的神经拟态系统Hala Point 。

具体来说,Hala Point系统由封装在一个六机架的数据中神思箱中的1152个Loihi 2处理器(继承Intel 4制程节点)构成,大小特别于一个微波炉。该系统提拔离别在 140544 个神经款式处理内核上的多达 11.5 亿个神经元和 1280 亿个突触,最大功耗仅为 2600 瓦。Hala Point还包括 2300 多个镶嵌式 x86 处理器,用于辅助缱绻。

Hala Point 将处理、内存和通讯通谈集成在大限度并行结构中,提供所有这个词 16 PB/s 的内存带宽、3.5 PB/s 的内核间通讯带宽和 5 TB/s 的带宽(TB/s)的芯片间通讯带宽。该系统每秒不错处理越过 380 万亿个 8 位突触和越过 240 万亿个神经元操作。

在用于仿生脉冲神经会聚模子时,Hala Point大略以比东谈主脑快20倍的及时速率运转其沿途11.5亿个神经元,在运转神经元数目较低的情况下,速率可比东谈主脑快200倍。诚然Hala Point并非用于神经科学建模,但其神经元容量约莫特别于猫头鹰的大脑或卷尾猴的大脑皮层。

早期接洽收尾标明,通逾期骗阑珊性高达10比1的阑珊勾通(sparse connectivity)和事件驱动的看成,Hala Point运转深度神经会聚的能效比高达15 TOPS/W,同期无需对输入数据进行批处理。批处理是一种常用于GPU的优化纪律,会大幅加多及时数据(如来自录像头的视频)处理的延伸。尽管仍处于接洽阶段,但昔日的神经拟态谎言语模子将不再需要如期在束缚增长的数据集上再检修,从而省俭数千兆瓦时的动力。

英特尔暗示,Hala Point在其前身Pohoiki Springs的基础上完了了大幅升迁,基于神经拟态缱绻时间升迁了主流、通例深度学习模子的性能和着力,尤其是那些用于处理视频、语音和无线通讯等及时责任负载的模子。其架构经过矫正,神经元容量提高了10倍以上,性能提高了12倍。

当今,Hala Point是一个旨在矫正昔日商用系统的接洽原型。英特尔瞻望其接洽将带来实质时间打破,如让谎言语模子领有从头数据中握续学习的智力,从而有望在AI等闲部署的进程中,大幅裁汰检修能耗,提高可握续性。

英特尔清晰,接下来,Hala Point系统将向桑迪亚国度本质室寄托,从而象征着英特尔分享的大型神经拟态接洽系统的初度部署,进一步鼓动神经拟态缱绻应用和类脑 AI 接洽等。如今,英特尔神经拟态接洽社区(INRC)成员总和已越过200个。

不外,英特尔这套神经拟态时间在深度学习界限仍濒临一定的质疑。

Meta首席科学家、图灵奖得主Yann LeCun曾在2019年的一次会议上褒贬了神经拟态缱绻纪律。他以为,神经款式纪律莫得赢得实质着力,像ResNet等深神经会聚也曾在缱绻机视觉上赢得了庞杂的得手。

不外,IBM于2014年推出了TrueNorth芯片,尽管其运转频率惟有几kHz,但它所模拟大脑尖峰神经会聚所需的缱绻资源,只传统处理器0.0001%。Mike Davies曾暗示,Loihi在某些特定责任负载上,不错比传统处理器着力进步2000倍。

新的 AI 时期也曾到来,Hala Point或将成为昔日英特尔大开AGI时期的进攻一把“钥匙”。

(本文首发于钛媒体App开云体育,作家|林志佳,裁剪|胡润峰)

]article_adlist--> 海量资讯、精确解读,尽在新浪财经APP