丹羿深度
艺术之都:荷兰阿姆斯特丹,深度参观梵高博物馆 #生活乐趣# #旅行建议# #深度游目的地#
AI时代产业链百花齐放,从海内外大厂如谷歌、亚马逊、Meta、open AI,以及国内BBAT从进行军备竞赛到模型推理反哺自身业务。AI云计算帮助提高各行各业的生产效率,以及渗透进入人们的日常生活中,出现AI端侧的创新设备如AI手机、AI PC、AI眼镜、AI耳机、AI玩具等等。AI模型推理场景,不仅需要大家熟知的 “ 算力 ” 芯片,数据存储的带宽和降本需求也是关键,基于先进封装的近存计算应运而生。
什么是定制化存储技术?
3D DRAM需要高度定制化,DRAM厂家根据逻辑计算芯片的需求来修建。本身DRAM颗粒需要做特殊设计,不是标准接口。如下图,CUBE是台湾的华邦电子开发的定制化存储器,采用TSV+Microbump工艺(与HBM类似),将堆叠了多层的CUBE放在逻辑芯片下面。具体的尺寸、层数都可以根据与逻辑芯片的适配去定制。
资料来源:华邦电子白皮书《CUBE 技术助力变革边缘 AI 计算》
国内A股上市公司兆易创新有领先的技术积累,采用wafer on wafer堆叠工艺(切割成颗粒前就进行存储晶圆的键合),并将3D DRAM放置在逻辑芯片之上。
3D DRAM相较于我们之前讨论过的HBM(网页链接{丹羿深度 | AI时代的存力明珠HBM})和传统DDR的优势:一是3D DRAM比HBM的功耗更低,适合端侧低功耗场景; 二是定制化实现更高带宽, 可通过定制更多I/O接口实现超高带宽,而传统DDR的带宽偏低;三是成本更低,对比海外存储大厂HBM颗粒十几美元/GB的价格,国产定制化存储有望实现显著的降本,更加适合端侧海量设备的普及。
3D DRAM 潜在限制为存储容量,这一点相较于HBM具有劣势。海外HBM3e颗粒适用于大算力芯片,存储容量达到百GB以上(HBM 单die是2GB, 堆叠8-12层是16-24GB,一个GPU周围放置6颗HBM)。3D DRAM能做到几十GB的水平,能够适用于部分云端的场景。
目前定制化存储技术的落地情况如何?
瑞芯微于今年7月17日开发者大会发布多款产品,旗舰新品包括全球第一颗3D堆叠的协处理器芯片RK182X系列(NPU),就搭载了兆易创新为其定制的存储器,实现百GB 级别DRAM带宽,端侧模型突破百Token/s,端到端响应延时低至0.1s。
预计未来几年内,我们会看到3D DRAM在更多的终端产品上落地,比如机器人、AI手机、AI PC、汽车里的智能座舱等等。
把握科技发展趋势和研究前沿技术是硬科技投资的灵魂,3D DRAM是具有巨大想象力的新型存储技术路线。这个新技术路线的问世,也证明了国内芯片公司从追赶复制海外厂商,到自身创新 “ 敢为天下先 ” 的实力跨越。
@今日话题 @雪球私募 @雪球创作者中心 #AI算力# #存储#
网址:丹羿深度 https://www.yuejiaxmz.com/news/view/1330583
相关内容
丹羿深度羿驰05:开启高效出行新篇章
易至羿·松烟黛墨典藏版:“用之美”的现代诠释与生活哲学
解码重庆羿马装饰:揭秘家居美学与品质生活新篇章
欧洁羿尔直立式地毯吸尘机OJER VP
丹佛斯地铁环境节能解决方案
蔚来的SUV旗舰ES8搭载光羿调光车窗,主打一个全场景是什么体验?
深度分析:丹麦居家养老模式:探寻其背后的生活哲学与社会制度,启发中国养老改革
在最深的人间收纳冷暖和挚爱!——叶又丹
中丹合璧,NEST空间传递丹麦幸福生活方式