0
联系电话:4001-158-698EN

公司新闻 行业动态 jinnianhui今年会产品知识

jinnianhui今年会|官网- 云天励飞发布未来三年算力芯片战略:聚焦推理效能升级,全线对标英伟达新一代产品

导语:云天励飞是海内寥寥可数手握足够国产产能保障的企业之一。

雷峰网(公家号:雷峰网)动静,2月3日,云天励飞初次对于外宣布将来三年的年夜算力AI推理芯片战略结构,将实现百万Tokens推理成本降低100倍以上的方针。

推理算力需求暴涨,是于行业中现实发生的布局性厘革。

德勤发布的陈诉指出2026年推理算力将占总体AI算力的66%,推理优化芯片市场于2026年将增加至超500亿美元。字节旗下豆包年夜模子Token利用量从2024年的单日0.12万亿,到2025年12月已经冲破50万亿。

多个行业旌旗灯号配合指向一个趋向:推理侧竞争已经再也不纯真是“把模子做患上更强”的参数竞赛,而是“让运用跑患上更久、更稳、更自制”的效能竞赛,单元推理成本与交付效率已经成为范围化落地的最年夜门坎。

“于推理芯片范畴,依托海内富厚的运用场景、不变靠得住的电网及快速迭代的开源模子,咱们具有弯道超车的能力,是以练习追逐、推理超车是将来5年咱们的计谋,而GPNPU则是AI推理芯片架构的最优解。”云天励飞董事长兼CEO暗示。

云天励飞发布未来三年算力芯片战略:聚焦推理效能升级,全线对标英伟达新一代产品

面向AI推理需求的发作式增加,云天励飞怎样计划下一阶段芯片研发线路图?又将怎样经由过程架构立异与技能冲破,真正实现算力效率晋升与全生命周期成本降落,从而于推理芯片范畴实现弯道超车?

GPNPU架构界说将来三年芯片线路:直指英伟达旗舰级算力产物

推理时代的胜败手不于单点指标,而于体系级协同:既要承接主流软件生态,又要于推理负载下实现更优能效与更低时延。

云天励飞确立了GPNPU技能线路,并提出了“GPNPU=GPGPU+NPU+3D重叠存储”的焦点公式,统筹通用计较的“通用性”与NPU的“高效性”。

云天励飞发布未来三年算力芯片战略:聚焦推理效能升级,全线对标英伟达新一代产品

于通用生态层面,鉴在CUDA仍是全世界最成熟、笼罩最广的加快计较平台之一,云天励飞的GPNPU架构致力在正视主流生态的迁徙成本问题,可以或许实现一行代码完成CUDA步伐兼容,极年夜降低了进入出产体系的门坎。

于推理能效层面,NPU可以或许实现更高的计较效率及能效比,面临年夜模子推理这类高度布局化、可被系统化优化的负载,专用化设计带来的能效上风更易转化为真实成本上风,这也是国际厂商连续加码专用线路的主要缘故原由。

同时,针对于行业公认的“内存墙”瓶颈,云天励飞正深度研发 3D 重叠存储和更前沿的互连技能,以晋升带宽与能效,降低推理时延。

“经由过程引入3D memory架构,咱们可以实现10倍在当前练习芯片HBM带宽的机能,其拜候时延将到达10纳秒级别,以实现极致的推理能效。”云天励飞CTO李爱军暗示。

于架构工程与产物化路径上,云天励飞提出“算力积木”架构,经由过程Chiplet扩大与互连思绪,将尺度计较单位举行模块化封装与组合,让算力像搭积木同样按需扩大,形成从边沿到更年夜范围推理的弹性产物形态。

其次是面向推理的体系级优化能力,公司拒绝纯真的“芯片参数竞赛”,而是主意把“模子怎么跑患上更省”沉淀到架构里,缭绕真实营业负载连续迭代,逐项击穿推理链路中的成本与时延瓶颈,终极形成可复制交付的解决方案。

“基在对于年夜模子推理的理解,咱们组织了PD分散体系架构,针对于年夜模子prefill及decode阶段差别的计较特色举行优化设计,于芯片的微架构层面上,咱们同时对于在Attention和FFN的计较的特色举行细粒度的阐发,从而进一步的去晋升咱们的推理效率。”李爱军说到。

云天励飞发布未来三年算力芯片战略:聚焦推理效能升级,全线对标英伟达新一代产品

集会上,云天励飞以推进百万Token推理成本每一年两位数的降低为方针,正式发布了将来三年的年夜算力芯片计划。

2026至2028年,云天励飞计划推出三代迭代芯片,节拍清楚对于标国际主流厂商。

第一代超节点P芯片将在本年推出,其将面向百万长上下文的场景举行极致的prefill推理优化,于算力上紧跟H100。

2027年,云天励飞将研发第一代超节点D芯片,以此于decode推理方面实现超低延时,而其算力机能将到达B200 相称的程度。

2028年,云天励飞将研发第二代超节点D芯片,致力在实现毫秒级的推理时延,从而使患上prefill及decode的机能年夜幅晋升,于算力层面,将对于标英伟达的下一代Rubin芯片。

云天励飞发布未来三年算力芯片战略:聚焦推理效能升级,全线对标英伟达新一代产品

手握「足够」国产产能,云天励飞买通研发、量产与范围化交付闭环

算力芯片的竞争已经步入新周期,多家公司登岸本钱市场以外,还有有年夜量创业公司逐渐崭露头角。

竞争白热化的行业景况下,陈宁指出,支撑公司超过周期的,是持久堆集修筑的贸易护城河。云天励飞的焦点竞争力,已经形成技能、产能、生态、市场、本钱五年夜维度的协同。

GPNPU的架构立异,以和三年年夜算力芯片计划的发布,实现了技能与产物的闭环。

于此之下,产能成为落地的要害。

针对于行业遍及存眷的供给链安全问题,云天励飞高级副总裁、CFO兼董秘邓浩然尤其夸大,公司今朝是海内寥寥可数手握足够国产产能保障的企业之一,这一战略贮备为后续芯片的年夜范围量产与交付提供了极高简直定性。

此外,云天励飞遭到本钱市场的高度存眷,具有充足的资金实力以支撑芯片研发的持久耗损,同时于顶级芯片人材的招揽上,也可以走于前列。

云天励飞发布未来三年算力芯片战略:聚焦推理效能升级,全线对标英伟达新一代产品

而为了应答市场竞争以和不确定性,云天励飞更将构造调解为更具韧性的“1+4”架构。

“1”指聚焦在AI年夜算力推理芯片,“4”则是四年夜事业部。作为生态构建者,四年夜事业部旨于解决芯片从“研发出产、优化打磨到市场推广”的焦点难题。此中,政企事业部作为基石,将依附深挚的行业经验,将战略重点转向推理装备及智算中央的设置装备摆设,以实现营业运转的协同闭环。

据悉,云天励飞正计划打造区域级“千卡集群”。

云天励飞发布未来三年算力芯片战略:聚焦推理效能升级,全线对标英伟达新一代产品

推理时代的竞争,素质是“单元推理成本”的竞争。只有把推理做患上充足自制、充足不变、充足易用,AI才能从“看患上见的能力”走向“用患上起的出产力”。

将来,云天励飞将以GPNPU架构为焦点,鼎力大举推进云端年夜算力强化软硬协同与存储系统攻坚,实现百万Tokens推理成本降低超100倍的方针。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-jinnianhui今年会|官网
1210
在线客服
在线客服

Maggie

微信咨询

黎小姐