当前位置 >> 首页 > 新闻动态 > 最新动态

U8国际·-GPU成本高企、显存墙难破,国产存储如何推动AI普惠化进程?

浏览:587

当前,AI运用市场的发作式增加正于催生对于高机能存储的巨年夜需求,但昂扬的GPU采购成本及难以超越的“显存墙”,却使很多巴望立异的企业望而生畏。面临这类布局性挑战与增加机缘并存的财产近况,国产存储新权势怎样依附新的体系级思维破局?

为了探访“从存储入手实现AI项目降本增效”的立异路径,咱们与铨兴科技eSSD产物线副总司理邱创隆及AI产物总监王瑜琨举行了深度对于话,配合解码AI时代下存储的体系级立异与成本致胜的底层逻辑。

重塑价值:存储成为TCO及效率的焦点驱动力

于AI的海潮下,存储的价值被完全倾覆。铨兴科技eSSD产物线副总司理邱创隆指出,已往存储像是一个IT体系里的“堆栈”,是副角。然而,跟着AI练习及推理负载的加剧,存储再也不仅仅是数据容器,它已经成为晋升AI体系效率、降低整体拥有成本(TCO)的要害战略环节。

△铨兴科技eSSD产物线副总司理邱创隆

邱创隆进一步阐明,AI时代存储模组厂商重要饰演着“承上起下”的要害作用。这要求企业必需洞察AI数据流五个阶段(数据读取、数据预备、模子练习、模子推理、数据归档)的差异化需求,将主控及闪存芯片举行深度调优及验证,确保企业提供应客户的是切合将来运用趋向的解决方案。

AI事情流正于驱动存储产物走向进一步分解。邱创隆暗示,单一的存储方案已经没法实现最优的成本效益,是以铨兴科技提供了条理清楚、精准匹配运用场景的eSSD产物矩阵,为差别需求的企业提供“速率阶梯”。

于AI推理(Inference)及检索加强天生(RAG)的运用阶段,负载特征显著转向“读取密集型”,对于容量及整体拥有成本(TCO)的要求到达极致。为此,铨兴科技推出了高密度的 PCIe 5.0 QLC eSSD系列,其容量高达122.88TB,并具有14,000MB/s 的顶级挨次读取速率。这款百TB级容量产物,相较传统硬盘能带来6倍的容量晋升,不仅能显著节省机柜空间及电力耗损,更从底子上优化了AI运用持久运行的TCO。

而针对于AI练习及HPC负载要求严苛的“混淆读写”机能及高靠得住性需求,铨兴则提供了旗舰级的 PCIe 5.0 TLC eSSD系列。该系列具有超14GB/s的持续读速及高达3300K的随机IOPS,提供极致的机能保障。同时,该产物还有立异性地配备了Dual Port(双端口)设计,能为永劫间、不间断的AI练习使命提供企业级的靠得住性与高可用性保障。

体系革命:“以存强算”,冲破GPU显存墙

只管经由过程eSSD产物矩阵解决了AI数据流于容量及速率上的分解需求,但对于在年夜模子部署而言,显存墙仍是AI普惠化最难超越的障碍。

铨兴科技AI产物总监王瑜琨指出,AI模子参数的增加速率已经远远甩开顶级显卡显存的线性扩容,形成为了难以超过的布局性鸿沟。他援引数据夸大:已往几年模子范围暴涨了约10倍,而显存容量仅微增2到3倍。鉴在模子范围于将来只会继承指数级爬升,对于显存的爆炸式需求,使患上传统“算力派”直不雅重叠天价显卡的计谋,不仅带来了巨额的硬件采购成本,也注定没法恒久撑持行业将来AI普惠化的方针。

△铨兴科技AI产物总监王瑜琨

是以,铨兴科技则选择了更具战略价值的“体系派的折叠梯”战略,推出了“添翼AI 超显存交融解决方案”。王瑜琨进一步注解,该方案的焦点于在“以存强算”的软硬一体架构,这一架构由两年夜部门慎密耦合而成。

硬件基础是一块专为AI负载设计的“添翼AI扩容卡”。它素质上是给GPU加装了一个超高速、遐龄命的“外挂”缓存,将单卡的等效显存容量有用扩大了 20倍,从而解决了传统闪存的寿命瓶颈。

软件焦点则是“AI Link算法平台”。该平台经由过程高度并行化的冷热存储智能调理,可以或许自立判定下一步运算所需数据,提早将存储于扩容卡中的“冷数据”高效搬运到GPU的“热情况”中,终极冲破了带宽墙的限定 。

这类体系级的架构重构带来了惊人的效益。王瑜琨吐露,以练习 671B参数年夜模子为例,原先需要 168张顶级显卡(部署成本年夜在4200万元)的使命,如今仅需16张中阶显卡+ 8张添翼扩容卡(造价不到200万元)便可胜任。这使患上企业的练习成本可锐减约95%,同时模子推理的并发机能还有能得到高达50% 的晋升,实现了成本与效率的两重冲破。

王瑜琨明确指出,面临显存的布局性挑战,行业必需采取更为高效的折衷方案。他夸大,将更年夜范围的模子参数迁徙至Flash闪存上,是鞭策AI普惠化进程、实现成本效益的将来一定趋向。

国产AI的底气:从显存冲破到全系统兼容性

为了将技能转化为出产力,铨兴推出了笼罩全场景的“Super AI”训推一体机系列(涵盖PC、事情站及办事器),旨于将AI普惠化下沉到中小企业、研究机构以致小我私家。依附显著的成本上风,“添翼AI”解决方案已经经于高校讲授、政务、法令等垂直行业实现了乐成落地。

与此同时,铨兴始终将多平台兼容性作为产物的基础。其eSSD产物矩阵的广泛合用性已经经由过程了包括高潮(Phytium)、龙芯(Loongson)、海光(Hygon)、兆芯于内的多家国产CPU平台及遐想、新华3、宁畅、超云、长城、金舟远航等办事器平台的验证,以和中泰证券、北京邮电年夜学等行业客户的严酷验证。这确保了不管是基础存储还有是AI加快方案,都能于主流计较情况中不变运行,为“Super AI”系列方案的推广奠基了坚实的基础。

对于在行业将来,铨兴科技采纳了eSSD产物矩阵连续进级及存算深度耦合技能集成两条清楚的迭代线路。

邱创隆副总司理披露了铨兴科技于存储产物进级方面的线路图。他估计,存储财产来岁 PCIe 5.0 将代替4.0成为市场主流。于此配景下,铨兴科技规划于来岁下半年推出下一代速率更快的 PCIe 6.0接口产物,以连续巩固其于高机能存储市场的职位地方。

针对于AI存算交融的持久趋向,王瑜琨认为,“以存强算”将毫无疑难成为AI行业的主流,并与算力实现更深条理的集成。他指出,从技能远景看,将来跟着PCIe 7.0等技能的慢慢落地,闪存的带宽将越发靠近DDR5,而容量却能到达数十倍,这将从底子上为AI普惠化奠基技能基础。

基在此,铨兴科技制订了清楚的持久方针:到2026年,实现将200B范围的模子部署到一台PC中,告竣万元如下的千亿模子部署;到2027年,则规划将万亿级另外参数搬到小我私家PC中,终极鞭策AI的广泛普惠。

结 语

跟着AI海潮深切财产要地本地,基础举措措施的成本与效率已经成为决议其运用广度的胜败手。铨兴科技依附eSSD产物矩阵的连续进级及“添翼AI超显存交融解决方案”的体系级立异,乐成买通了“算力”与“存储”之间的布局性瓶点。这不仅为AI年夜模子部署提供了一条成本锐减90%的新路径,更将万亿参数模子由云端拉向了终端,极年夜地拓宽了AI技能的运用规模。

放眼业界,于AI普惠化的时代配景下,“以存强算”及“软硬协同”已经成为全世界存储厂商配合发力的立异赛道。各方正踊跃摸索立异介质及深度算法,致力在冲破显存价格的高墙,鞭策AI运用真正普和。

-U8国际

下一条
热门标签
分享到
在线电池裸电芯外观检测 iis7站长之家