存算一体芯片,这几年可能就要覆盖从端到云

发布时间:2022年08月21日
       我们之前已经讨论过存储计算一体化和内存计算的概念。尤其是在发展时代的背景下, 存储墙问题日益成为计算能力不断提升的瓶颈, 因此业界提出了非丰(Fon)架构, 它改变了传统的、以计算为中心的冯诺依曼架构并改变计算范式。将部分计算能力下推到存储上也有内存计算的说法。
       这个概念有不同的实现。通常, 这种集成的存储-计算结构可以理解为在内存中嵌入算法, 而存储单元本身具有计算能力, 理论上可以消除数据访问的延迟和功耗。该芯片特别适用于神经网络。昨天的第二届中国(上海自贸区临港新区半导体产业发展高峰论坛芯片路演活动), 北京智存科技有限公司的王少迪谈到了自己的2101:集成存储与计算芯片;以及今年的未来记忆战略规划。
       解决储物墙问题 下面王少迪给出的图片提到了一些储物墙问题。典型数据;主要体现在, 随着制程技术的进步, 处理器的计算能力越来越强, 运算速度越来越快, 存储容量越来越大, 但内存带宽却难以实现同比增长生长。增加, 处理器核心数量增加, 每个核心的可用带宽越来越少, 这限制了整体速度。移动数据已成为一个相当大的瓶颈。同时, 能源消耗也是一个问题。从外部存储器、片上存储移动数据的能耗变化很大;数据移动时间是计算时间的数百到数千倍。这就是为什么你想做存储和计算的集成解决方案吗?存储墙最根本的解决方案是存储和计算一体化, 使用存储单元进行计算。王少娣说道。内存计算这个名字可能更好, 就是用内存进行计算,

整体还是一个计算型的芯片。它的计算介质是内存, 而不是逻辑运算单元。上图比较了两者的结构差异, 其中圆圈代表记忆单元。不同于传统的计算架构, 存储子系统一次激活一行, 依次完成数据读取;存储计算一体化架构同时激活多行多列。横轴不再是选择信号, 实际上是处理后的数据。在此过程中, 需要将其转换为模拟电路。前面我们也提到过, 使用单个设备的欧姆定律进行乘法运算, 然后使用基尔霍夫定律进行列累加。这样, 使用存储设备单元完成了乘法和加法计算。一个内存操作周期可以完成100万次参数的乘加, 效率提升50100倍。显然, 这是非常有价值的。就更具体的使用场景而言, 对于从设备端到云端的计算,

计算能力的弹性扩展在存储计算一体化的芯片产品中似乎有着天然的优势。 2、4、8算力相对较低, 可用于端侧设备;如果存储和计算集成阵列达到128个, 则可以用于边缘侧;如果存储容量达到1、2、4, 则可以提供1000以上的算力。
        , 使用云场景。存储与计算的融合需要58年才能覆盖计算场景, 从端侧和边缘侧开始。王少娣说道。上图也清楚地表明同样场景下的芯片, 未来的市场规模和发展潜力也应该是众所周知的。从智存10到智存30 从智存的发展轨迹来看, 两位创始人都有早期在美国参与存储计算一体化项目研发的经验; 2017年成立智存科技, 次年获得。进行天使轮融资。这仍然是一家相当年轻的公司。 2019年,

智存与国际知名企业合作研发集成存储与计算, 完成芯片流片测试, 发布全球首款存储与计算集成芯片。 2020年, 智存完成了全球首款集成存储与计算芯片的量产, 以及全球首款集成存储与计算芯片的验证。王少迪推出的2101内存计算集成芯片有望在今年第四季度量产。似乎存储和计算概念的发展速度比我们预期的要快得多。上图左侧是2101芯片架构图。存储计算一体化的内存主体部分的大部分操作都是通过存储计算一体化完成的;此外, 它还具备提供非矩阵运算的能力。与现有市场解决方案的计算能力和功耗相比, 2101具有10倍以上的优势。虽然不清楚这张图中目前市场上的解决方案是什么, 但2101一栏标注的算法复杂度和功耗确实相当惊人。除了介绍产品, 王少迪还谈到了智存的战略规划。从公司成立到2020年是知识与存储10的时代。
       在这个阶段, 将存储与计算一体化技术开发并应用到语音场景中。王少娣也再次强调, 我们是世界上第一个落地的技术。的公司。今年到2024年, 属于智存20规划期,

进一步推进到128, 达到6.41万算力水平, 覆盖端侧和边缘侧场景。我们将选择有利的场景来实现应用程序。 2024年之后, 芯片将推向云端, 实现1容量500.2万算力范围, 产品实现车规级可靠性。 2025年后规划标准化产品。之后, 产品不再面向应用场景, 而是提供内存等不同容量, 与现有计算系统集成, 并与先进封装技术完成集成。同时, 我们还推出了相应的工具链, 全面适配存储计算一体化技术, 适配主流人工智能算法。注意, 该图横轴收入和纵轴市值预测均表明公司对未来短期内的发展有足够的信心。或许这张图本身也能代表未来几年存储与计算一体化技术的发展趋势。责任编辑: