这家公司的背后,站着连续六轮砸下超20亿元的腾讯,以及一群来自清华EE85班的“芯片老兵”。创始人赵立东与张亚林,两位前AMD高管,用18个月流片成功的纪录,将燧原推至行业风口。
其“邃思”系列芯片已渗透腾讯会议语音转文字、甘肃庆阳国家算力枢纽万卡集群,性能对标英伟达A100,液冷算力集群能效利用率达92%。
但光环之下,挑战同样尖锐:台积电12nm制程落后国际两代,CUDA生态开发者仅8.7万,全球化拓展步履维艰。这场IPO,既是70亿资本催熟的果实,也是国产算力突围的关键一役。
2018年3月,上海临港新片区的一间办公室里,赵立东与张亚林签署了燧原科技的创立协议。
这两位曾在AMD共事多年的“硅谷老兵”,彼时已分别在中国半导体产业中留下深刻印记。
赵立东,清华大学EE85班成员,曾主导AMD上海研发中心,参与Ryzen处理器核心研发;张亚林,则带领团队量产微软Xbox主芯片,手握12项专利。
他们的合作,被业内视为“技术定义者”与“量产操盘手”的强强联合。
赵立东自2007年加入AMD后,负责CPU/GPU核心研发,管理超千人团队。
2014年回国加入紫光集团,主导锐迪科微电子的收购与整合,推动紫光在通信芯片领域的布局。
然而,他始终怀揣“在中国定义全球性芯片产品”的野心。2018年,赵立东离开紫光,与张亚林共同创立燧原科技,目标直指被英伟达垄断的AI训练芯片市场。
公司成立仅一个月,燧原科技即获亦合资本、真格基金等机构的种子轮融资,验证了创始团队的行业号召力。
五个月后,腾讯以3.4亿元领投Pre-A轮,这一动作被赵立东称为“热启动战略”:腾讯不仅注资,更开放云服务场景,使燧原芯片在研发阶段即与腾讯会议语音转文字、OCR识别等实际需求深度耦合。
此后六年,资本狂潮汹涌而至——红杉中国、国家大基金二期、CPE源峰等机构接连入场,累计融资近70亿元,腾讯六轮参投,持股20.494%,稳居第一大股东。
资本推力下,燧原团队迅速扩张。
研发人员占比70%,核心成员多来自AMD、英伟达、海思,形成“硅谷基因+本土化创新”模式。
2019年6月,首款AI训练芯片“邃思1.0”流片成功,耗时仅18个月,创行业纪录。这款采用台积电12nm工艺的芯片,算力达128TFLOPS(FP16),首次在腾讯云实现国产训练芯片商用。
2020年,云燧T10训练加速卡问世,算力翻倍至256TFLOPS,适配万亿参数大模型训练,落地湖北宜昌智算中心,上架率超80%。
商业版图同步扩张。
2023年,燧原科技中标中国移动(甘肃·庆阳)数据中心项目,建成国产首个万卡推理集群,单集群算力40EFLOPS,入选国家算力网络枢纽节点。
互联网客户覆盖腾讯、爱奇艺,金融领域落地实时反欺诈系统,响应时间缩至毫秒级;自动驾驶合作车企进入路测阶段。
截至2024年8月IPO启动前,燧原科技估值达160亿元,,但未披露具体盈利数据。
燧原科技的技术突围,始于对英伟达垄断市场的精准打击。其“三板斧”策略——高性能芯片、液冷算力集群、自主软件生态——直指国际巨头的核心壁垒。
2019年发布的“邃思1.0”采用台积电12nm工艺,支持混合精度计算,能效比达1.2TOPS/W,较同期英伟达V100落后15%,但价格仅为后者60%。
2021年迭代的云燧T20训练卡,算力提升至**TFLOPS,支持FP8精度,适配Llama 3等万亿参数模型训练,在腾讯元宝AI工具中实现20倍DAU增长。
2024年推出的云燧i20推理卡,INT8算力**TOPS,能效比1.5TOPS/W,液冷版S60功耗仅150W,支持高密度部署,应用于庆阳万卡集群,算力利用率达92%。
燧原科技的液冷算力集群采用冷板式散热方案,单机柜功率密度40kW,较传统风冷能耗降40%。其动态资源调度算法可自动平衡算力负载,在甘肃庆阳项目中,万卡集群延迟低于5微秒,支持千亿参数模型实时推理。
这一技术使燧原成为国内唯二(另一家为华为昇腾)实现千卡级AI集群商业落地的企业。
软件生态是燧原与英伟达的最大差距。
2021年推出的“驭算”编程平台,支持TensorFlow、PyTorch框架迁移,预置200+算子库,模型训练效率提升50%。
配套的“鉴算”推理引擎实现模型量化压缩,ResNet-50推理延迟压至5ms,较开源方案优化60%。
但与CUDA生态的300万开发者相比,“驭算”注册开发者仅8.7万,算子覆盖率不足60%。为此,燧原计划投入IPO募资的20%开发CUDA兼容工具链,目标2025年实现90%算子兼容,迁移成本降至人均40工时。
在腾讯生态内,燧原芯片支撑语音转文字响应时间缩至毫秒级,OCR识别准确率提升至99.3%。
2024年发布的“燧原曜图”文生图工具,基于自研芯片实现每秒20张4K图像生成,成为国内首个支持实时渲染的AI创作平台。
金融领域,某头部银行采用云燧i20完成每秒万级交易反欺诈分析。
自动驾驶合作中,多传感器融合算法算力密度较GPU方案提升2倍。
工信部数据显示,国产AI芯片在智算中心的采购占比从2023年的18%跃升至2025年的47%,市场规模突破600亿元。
这场狂欢背后,既有技术突破的里程碑,也暗藏供应链与生态的深层隐忧。
1. 狂欢:政策红利与技术突破的双重催化
2024年,财政部等四部门联合发布《算力基础设施高质量发展行动计划》,明确要求新建智算中心国产芯片使用比例不低于50%,采购补贴最高达30%。政策直接推动订单激增:
燧原科技中标中国移动(甘肃·庆阳)数据中心万卡集群项目,合同金额8亿元,采用云燧i20液冷推理卡,算力利用率达92%;
华为昇腾拿下国家电网智能巡检系统升级项目,部署昇腾910B芯片超5万片,推理效率提升40%;
寒武纪与合肥市政府共建200PFlops算力中心,思元590芯片部署量超10万张,主要用于交通监控低光场景优化。
技术突破同步加速。
燧原科技的云燧T20训练芯片在腾讯元宝AI工具中支撑DAU增长20倍,语音转文字响应时间缩至0.8秒;
壁仞科技BR104芯片在Llama3-400B模型训练中,单卡性能达英伟达A100的72%,成本仅后者50%。
国产芯片的性价比优势,使其在互联网、金融等市场化场景中逐步渗透:某头部银行采用燧原方案后,实时反欺诈分析成本降低60%,处理速度提升3倍。
2. 隐忧:技术依赖与生态短板的双重枷锁
国产替代的狂欢难掩底层危机。
制程困局:燧原云燧T20依赖台积电12nm工艺,晶体管密度仅33.8MTr/mm²,较英伟达H200的4nm工艺(138MTr/mm²)落后两代。若被列入实体清单转向中芯国际14nm,芯片面积将增加58%,功耗飙升45%,性能损失达35%。
HBM断供风险:国产芯片的HBM(高带宽内存)完全依赖SK海力士、三星供应,燧原庆阳项目储备量仅够12个月,而英伟达通过自研HBM3E将显存带宽提升至4.8TB/s,形成代际压制。
生态孤岛:英伟达CUDA生态拥有300万开发者,支持2000种模型一键部署;燧原“驭算”平台注册开发者仅8.7万,算子覆盖率为58%,迁移成本人均120工时。华为昇腾虽开放硬件授权,但CANN软件适配效率仍落后CUDA 30%。
地缘政治进一步加剧不确定性。
2024年美国商务部更新实体清单,新增壁仞科技等5家中国芯片企业,限制其获得14nm以下制程技术。
英伟达对华特供版H20芯片性能缩水85%,但单价高达11万元,迫使国产企业陷入“高价低效”与“技术卡脖”的两难。
3. 博弈:从“替代”到“共存”的战略转型
面对压制,国产阵营转向差异化竞争:
混合架构突围:壁仞科技推出异构GPU协同训练方案(HGCT),支持与英伟达芯片混用,训练效率损失控制在15%以内;
边缘计算卡位:寒武纪思元590在智能摄像头市场市占率达35%,低光场景识别准确率提升至92%;
政策市场捆绑:燧原科技联合腾讯云推出“元算力”订阅服务,客户可按需调用国产算力,成本较英伟达方案低30%。
但国际巨头的反制同步升级。
英伟达2025年推出Blackwell芯片,FP8精度训练效率较H200提升2倍,并联合Meta、谷歌成立“AI计算联盟”,通过框架优化巩固CUDA生态壁垒。
AMD则通过MI300X芯片降价20%,在中国互联网企业订单中抢夺燧原、华为的份额。
国产AI芯片的替代浪潮,是政策意志、资本推力与技术突围的合力。
燧原科技、华为昇腾等企业通过智算中心建设、边缘场景卡位和混合架构创新,在1540亿美元的全球市场中撕开一道缺口。
然而,制程代差、生态短板与地缘绞杀的三重枷锁,仍将长期制约其发展。
这场博弈的本质,是从“替代”到“共存”的范式转换。
国产芯片企业需在3nm工艺研发、CUDA兼容工具链构建与供应链冗余建设上持续加码,方能在英伟达每年47亿美元的研发火力下守住阵地。
燧原科技的IPO,既是国产算力的高光时刻,更是新一轮竞速的起点——唯有跨越技术、生态与商业化的三重裂谷,才能真正实现从“可用”到“好用”的质变。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。