新闻

你的位置:开云(中国)kaiyun体育网址-登录入口 > 新闻 > 开云体育(中国)官方网站如故AI算法的调优以及大限制集群的运维会诊追踪-开云(中国)kaiyun体育网址-登录入口


开云体育(中国)官方网站如故AI算法的调优以及大限制集群的运维会诊追踪-开云(中国)kaiyun体育网址-登录入口

发布日期:2025-12-12 17:34    点击次数:186

  11月12日,中国东说念主工智能产业定约第十三次全会在北京召开,华为数据存储衔接中国信通院、工信部东说念主工智能要道时间和应用评测实验室、工商银行、中国迁移(600941)、中国联通、百度、阿里云、腾讯云、蚂齐集团等慎重发起“大模子基础顺次高质料发展行动谋略”,该谋略从需求角度启程,以升迁大模子基础顺次的质料与遵守为成见,共同加速布局“高效计较颐养+高性能AI存储+高通量蚁集+高遵守配置平台+智能化运维平台”,助力大模子工程化落地。

  华为闪存存储边界总裁黄涛参与驱动典礼,并算作激动谋略代表发表《构建先进AI存储,助力AI大模子高质料发展》主题演讲。

  东说念主类愚弄数据在AI边界取得长足发展,数智期间是数据的黄金期间,跟着数据限制爆炸式增长、数据价值收敛攀升,但同期咱们濒临xPU与存储的带宽不及、算力集群可费用低、推理时延迟等挑战,这对存储提议更高要求。黄涛提议,具备极致性能、高膨胀性、数据韧性、可捏续发展、新数据范式以及数据编织智商的新一代AI存储是通往AI数智期间的必由之路。

  以存强算,AI集群可费用升迁30%

  跟着AI集群限制的扩大,故障率也随之变高,当今业界千卡以上的AI集群可费用相似不及50%,这意味着,即使咱们收敛增多xPU的数目,其可费用却呈反比责备,这关于资本腾贵的AI集群来说是极大的资源糜费,而升迁试验集群存储性能不错大幅裁汰数据集加载时辰,达成秒级CKPT(查验点)保存,分钟级断点续训,灵验升迁算力集群可费用。

  数据编织,达成跨域数据高效归集,数据全局可视可管

  跟着大模子的限制规章(Scaling Law)收敛演进,不管是在进行CKPT的并行保存与加载、多模态数据的网罗与清洗、全局数据的Shuffle(混洗)与模态对王人,如故AI算法的调优以及大限制集群的运维会诊追踪,都贫乏需要一个全局平等分享、单一定名空间、且具备高性能并行读写智商的大型文献系统。这么的系统约略幸免多文献系统和多集群之间联邦式的低效堆叠,从而显贵简化大限制集群环境下的数据颐养和数据管制进程,进而捏续提高数据供应的效果。

  以存代算,长牵记内存型存储升迁推理体验并责备系统资本

  AI推理是企业达成AI应用生意化的先决条目,长落魄文处理时间不仅显贵升迁了模子在各种化任务中的进展,何况为模子在履行应用中的庸碌应用打下了坚实的基础。彰着,Long Context(长落魄文)处理时间还是成为推理时间改日发展的主要趋势。可是,在履行应用中,长落魄文处理濒临着资本腾贵和体验欠安的双重挑战,尤其是在推理过程中KV-Cache存不下问题尤为隆起。贫乏需要科罚KV-Cache的全局分享和推理牵记的捏久化问题。因此,将KV-Cache达成分层缓存,并确保其高性能走访,通过长牵记内存型存储以存代替算来升迁推感性能和资本效益,已成为时间发展的主流标的。

  中国的AI存储快速发展,华为与清华MADSys衔接的存储决策,在24年头度得到MLPerf Storage测试天下第一,2节点AI存储性能高达679 GB/s,性能筹算达到第二名的2倍,在单元空间内不错提供更多的性能。

  存储系统存在于大模子人命周期的每一环,是大模子的要道基座开云体育(中国)官方网站,先进AI存储约略升迁试验集群可费用,保险数据安全,责备推理资本升迁用户体验。黄涛示意,在数据的黄金期间需要AI原生计储,产学研用需要加强互助引颈AI原生计储发展标的,助力AI大模子高质料发展。



上一篇:开云体育制造业采购司理指数(PMI)等进攻经济数据回升较快-开云(中国)kaiyun体育网址-登录入口
下一篇:欧洲杯体育价钱上限34.48元/股-开云(中国)kaiyun体育网址-登录入口

Powered by 开云(中国)kaiyun体育网址-登录入口 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024