物联传媒 旗下网站
登录 注册
RFID世界网 >  新闻中心  >  今日话题  >  正文

云天励飞公布大算力芯片战略,誓将推理成本“狂砍”100倍

作者:来源网络(侵权删)
来源:RFID世界网
日期:2026-02-05 16:21:46
摘要:近日,云天励飞以一场“大算力芯片战略前瞻会”向行业投下重磅炸弹:未来三年聚焦大模型落地成本攻坚,剑指百万Tokens推理成本降低100倍!
关键词:算力

当AI大模型从实验室走向千行百业,成本与效率的博弈正成为行业破局的关键。


近日,云天励飞以一场“大算力芯片战略前瞻会”向行业投下重磅炸弹:未来三年聚焦大模型落地成本攻坚,剑指百万Tokens推理成本降低100倍!


与此同时,公司2025年业绩预告释放积极信号——营收最高预增52.61%,亏损大幅收窄。


这场“技术+商业”的双轮驱动,能否为行业撕开一条普惠AI的新赛道?


芯片战略:从“算力竞赛”到“成本革命”


近年来,全球AI产业格局正经历深刻重塑,其发展重心从“重训练”逐步转向“重推理”。


根据IDC预测,推理算力占比将持续攀升,2024年占比40%,2027年将达70%。而这一转变的背后,是AI应用场景的加速落地与使用频次的爆发式增长,推动算力需求结构发生根本性变化。


然而,在AI大模型狂飙突进的同时,一个关键瓶颈日益凸显:高昂的推理成本正成为AI规模化落地的“阿喀琉斯之踵”,严重制约了技术从示范走向普及。


面对这一行业性挑战,云天励飞选择将战略重心聚焦于攻克大模型落地的“成本壁垒”,通过底层架构创新开启“成本革命”。公司提出“百万Tokens推理成本降低100倍以上”的突破性目标,旨在推动AI技术从实验室走向普惠化应用,真正成为赋能千行百业的生产力工具。


为实现这一目标,云天励飞确立了GPNPU技术路线,构建起“GPNPU=GPGPU+NPU+3D堆叠存储”的核心技术框架。该架构创造性地兼顾通用计算的“通用性”与NPU的“高效性”,在工程层面同步解决可迁移性、可部署性和持续降本三大难题,为推理时代提供系统级解决方案。


在生态兼容性方面,针对CUDA作为全球主流加速计算平台的现实,云天励飞的GPNPU架构实现了“一行代码完成CUDA程序兼容”,这种生态适配能力,显著降低了技术迁移门槛。


针对推理场景的能效优化,云天励飞通过引入针对大模型推理高度优化的NPU单元,并结合3D堆叠存储等先进技术来突破“内存墙”限制,从而在系统级提升带宽、降低时延,将能效优势切实转化为真实的成本优势。


在架构工程创新层面,云天励飞强调了两大务实策略:

①“算力积木”架构:基于Chiplet扩展与互连技术,将标准计算单元进行模块化封装,支持算力像搭积木般灵活扩展。这种设计使产品形态能够覆盖从边缘计算到大规模推理的全场景需求。

②系统级优化导向:拒绝单纯的“芯片参数竞赛”,将“如何让模型运行更高效”的核心问题融入架构设计。通过围绕真实业务负载持续迭代,系统性地破解推理链路中的成本与时延瓶颈。


业绩表现:营收增长,亏损进一步收窄


日前,云天励飞发布2025年年度业绩预告,公司主营业务经营保持稳健增长势头,预计2025年公司营业收入、毛利率较上年同期均提升显著,公司亏损进一步收窄。


根据业绩预告显示,预计云天励飞2025年营业收入为11.3亿元至14亿元,同比增长23.18%至52.61%;预计实现归属于母公司所有者的净利润为-4.71亿元至-3.51亿元,亏损同比收窄18.64%至39.36%。


关于本期公司业绩亏损变化的原因,云天励飞表示,公司企业级和消费级场景业务的销售收入大幅增长,综合毛利润较上年显著提升,促使公司亏损收窄。


同时,为把握行业发展机遇,巩固公司核心技术竞争优势,云天励飞在高端人才、底层技术方面继续加大投入。报告期内,公司研发投入仍保持较高水平,故公司经营毛利未覆盖研发等方面投入,呈现亏损状态。


展望未来,云天励飞将继续深耕核心业务,持续推进技术创新与市场落地,进一步提升盈利能力与经营效益。


行业视角:AI普惠时代加速到来?


当前,全球AI行业正迈入从“模型构建”向“价值创造”的关键转折期,产业逻辑也正经历多维度重构。


技术层面,单纯追求参数规模的“军备竞赛”已显疲态,增长曲线趋于平缓。行业焦点正从“把模型做得更大”转向“让应用跑得更稳、更省”。技术创新重点不再局限于提升理论性能峰值,而是更加聚焦于优化工程落地与部署效率。


商业层面,企业客户对AI投入的审视日趋理性务实,投资回报率(ROI)已成为决策的核心标尺。在规模化部署的进程中,推理成本的可控性、解决方案的稳定性以及整体运营成本效益等,正超越单纯的性能参数,成为采购决策中更具分量的决定性指标。


政策层面,国家“人工智能+”行动计划的推进,明确提出要降低技术应用门槛、赋能广大中小企业。这要求产业界不仅提供先进技术,更需通过架构创新与成本优化,打造“用得起、用得好”的算力基础设施,使AI红利能广泛渗透至实体经济各毛细血管。


而这一切的共同作用,清晰地指向同一个产业刚需:一场以“极致性价比”为核心的算力成本革命已势在必行。这也正是云天励飞提出“成本革命”战略的深层背景——AI普惠并非自然结果,而是需要通过创新实现的技术经济可行性突破。


写在最后


随着全球算力产业的风向标加速向推理侧倾斜,一场围绕“单位推理成本”的竞赛已然拉开序幕。当推理成本真正降至足够低的水平,AI才能真正走出实验室和演示场景,成为千行百业日常可依赖、可负担的通用生产力工具。这场围绕成本效率的竞赛,将最终决定AI普惠时代的到来时间和普及广度。


视觉物联生态圈已开启产业交流群,欢迎对行业感兴趣的读者扫码下方二维码加入相关产业群聊,一起交流分享最新动态与前沿资讯。

图片

延科 18922857775

扫码添加微信

加入相关产业群聊