存算一体技术,何去何从?
数据来源: 半导体芯闻
发布时间:2022-11-21

摩尔定律逐渐走向消亡之际,应用端对芯片性能的要求却日渐提升。这种情况下,半导体从业人员就开始寻找另外的出路,存算一体就是其中的一个选择。

所谓存算一体,从字面上理解,就是把存储和计算融合成一体。众所周知,现行的计算领域所流行的是冯诺依曼架构。在这种架构下,存储和计算是分开的。这两部分的制程技术还能同步发展,这也推动了芯片性能在过去几十年获得了几何级增长。但进入最近这些年,芯片碰到了“存储墙”问题,叠加行业在存算一体技术研究的进展,使得这个早在上世纪七十年代就被讨论的技术,逐渐走向了台前。

知存科技创始人创始人和CEO王绍迪也表示,摩尔定律走到头了,就算强行继续往下走,代价也非常大,带来的提升又很有限。“为了在短期内实现算力的继续提升,存算一体是最好的方式。”

存算一体的路线选择

据王绍迪介绍,存算一体技术可以根据路线和存储材质的不同进行分类。例如从存储角度看,就可以考量其速度和密度。以大家熟悉的存算一体路线SRAM和Flash来看,前者拥有最快的速度,后者拥有更大的密度。

“在实际路线实践中,团队需要基于自身的技术积累进行选择,在发展的过程中还需要扬长避短,因为不同的技术都有优劣势。”王绍迪接着说。他指出,从计算的角度来说,存储器的调用方式是全并行调用,而存储的调用是一行一行的调用。这就意味着存储器在传统存储里面积越大速度越慢。但在存算一体中,面积越大,虽然速度变慢,但并行度在提高,所以整体算力是在增强的。换而言之,在存储和计算中,存储器表现出来的特点不是完全一致。

基于这些理解,王绍迪成立了知存科技,并选中了拥有高密度、低成本、高集成性,且单个单元可以做多比特等优点的Flash作为载体,开始了公司的存算一体之路。

从王绍迪的介绍我们得知,虽然Flash拥有读取速度慢和寿命短等缺点,但这在存内计算中这并不存在,因为存内计算过程中只需要用低电压的推理操作——一个不损失存储器寿命的方式,所以Flash的这些缺点都被一一避开了,这也最终促成了知存科技选择以Flash为载体打造其存算一体产品线。通过技术创新,知存科技使用Flash存储器完成神经网络的储存和运算,解决AI的存储墙问题,提高运算效率,降低成本。

王绍迪表示,知存科技创始团队从2013年就开始在做存内计算技术相关的研究,公司在存算一体领域也做过很多0到1的突破,包括验证过第一个存算一体技术在芯片上的成功性,验证了存算一体的第一颗量产芯片。

据透露,早在2016年的时候,知存科技团队的首席科学家作出第一个存内计算芯片的验证。在那之前,是没有任何一个存内计算能够跑三层以上的深度学习网络,但知存科技的首席科学家在当时就做出了能够跑50万个神经元的三层神经网络产品。

“基于这些技术积累和产品,知存科技的存算一体芯片将首先用在可穿戴设备商以及一些电池驱动的设备上。明年预计将会推广到算力更大的移动侧设备当中。”王绍迪说。

而为了达成公司的长远目标,王绍迪分享了他对存算一体技术未来发展的一些看法。

存算一体何去何从

如王绍迪所说,工具链对于任何芯片的使用都是非常重要。尤其是在存算一体芯片方面,因为是一个新架构的新产品,并没有现成的工具可用,因此如何打造一套可用的工具链显得尤为重要。知存科技在过去多年中也面向端侧应用开发出了可用的工具链。

“在未来的边缘计算产品,需要的工具链会是更复杂,所以我们现在公司超过一半的人在做软件集成开发环境。”王绍迪接着说。他表示,我们甚至还需要从训练开始,将存算一体技术融入其中。

据介绍,目前大部分开发算法的人用的是纯GPU的环境,但存算一体的算子跟GPU的算子显然不一样,计算的精度、模拟精度的定义和GPU计算的定义也都是不一样的。因此如果不去了解,或者软件工具不好用的话,那么就只能在GPU上做这个事情。“因此我们要解决这个问题,我们有极强的开发环境,里面虽然会调用GPU,但是调用GPU训练的时候,已经把存内计算的特点放进去了,这样就可以在开发过程中针对存内计算的场景去开发这个算法。”王绍迪告诉记者。

在王绍迪看来,存算一体就是计算模块,并不是存储,里面存放的只是相当于算法数据,其作用是新一代的计算技术,所以他们把存算一体看成新一代计算的模块,就像从CPU到GPU一样,GPU再到存算一体,从一维到二维到三维的计算的转变。这也就是为什么他认为存算一体未来更需要的是软件、生态怎么跟现有的计算系统更好地融合,更低成本地去开发,这也是存算一体的最终极形态。

除此以外,王绍迪也对存储一体的另外发展形态方向做了分享。如是否能以IP模式与其他计算模块集成,就是业界关注的一个热点。

针对这个问题,王绍迪回应道,IP模式是存算一体很适合走的道路,但难度大。一方面因为这需要考虑IP的接口完备定义以及和现有的要兼容;另一方面,这些IP加进去之后,是否要改变原有主芯片量产的流程?带来的替城成本和时间成本也让人更加谨慎。

为此王绍迪认为,存内计算最好的解决方式是未来通过chiplet的形式去结合。

在谈到存算一体技术未来的技术演进的时候,王绍迪表示,存算一体芯片一部分会遵循摩尔定律,一部分又不遵循摩尔定律。前者的代表是存储部分,后者的代表是计算部分。

“目前的存内计算大家都没有采用最先进的工艺,因此未来几年,在逻辑数据流当中的提升,大家还是会按摩尔定律继续往下走去提升。”王绍迪说。

他同时强调,存储技术技术会是存算一体技术发展的主要限制因素。“但目前存储技术已经远远领先于采用的容量了,距离我们达到存储器制约还有十年左右的时间。因此我们目前的工作重点在于如何继续创新,发现更多的问题,解决问题。”王绍迪说。

免责声明:本网站内容来自作者投稿或互联网转载,目的在于传递更多信息,不代表本网赞同其观点或证实其内容的真实性。文章内容及配图如有侵权或对文章观点有异议,请联系我们处理。如转载本网站文章,务必保留本网注明的稿件来源,并自行承担法律责任。联系电话:0535-6792766