
近日,由业界知名芯片设计师Jim Keller掌舵的人工智能计算公司Tenstorrent,在日本东京举行的TT-Deploy JP大会上推出适配智能体AI的TT-Ascalon S RISC-V CPU IP,其仅用一半的面积就实现了前一代1.4 倍的单位面积性能。
据了解,本次大会公布的所有技术突破与落地项目,均依托Tenstorrent核心的单一AI架构搭建。该架构最大优势在于运行大型AI工作负载的速度优于传统GPU,同时具备极强的拓展性,可凭借标准以太网,从授权核心灵活拓展至Tenstorrent Galaxy超级集群,兼顾高性能与高适配性,打破了传统AI部署的性能与拓展瓶颈。相较于行业主流方案,Tenstorrent网络化AI架构具备开放、通用、灵活的核心特质,支持异构部署与独立部署双重模式,能够适配AI行业快速迭代的发展节奏,为企业级AI部署提供全新解决方案。
在AI推理性能层面,Tenstorrent基于现有技术持续迭代升级,公布了Galaxy Blackhole超级集群的最新基准测试数据,在大语言模型、视频生成领域实现跨越式突破,多项指标大幅超越GPU设备。大语言模型推理方面,Kimi K2.6模型实现每秒每用户900个token的处理速度,性能达到GPU的3倍;DeepSeek-R1-0528 671B模型单用户每秒可处理超400个token,较此前TT-Deploy SF大会公布的350余个token/秒的成绩实现稳步提升。
视频智能处理领域,Tenstorrent的技术优势更为突出。其搭载的LTX 2.3 Fast模型,可在144帧/秒的高速下生成6秒、24帧标准画质的视频,全程完美适配音频与唇音同步效果,整体处理速度是GPU的4倍。值得关注的是,该架构可兼容多款不同系列AI模型,且系统容量能够随Galaxy集群规模扩大实现近乎线性增长,助力企业低成本、高效率拓展高级AI推理工作负载,适配规模化商用场景。
本次大会的核心新品之一——TT-Ascalon S高密度RISC-V CPU IP,标志着Tenstorrent进一步完善AI硬件产品矩阵,适配新兴智能体AI工作负载需求。相较于传统AI算力依赖原始计算能力的特点,智能体AI更考验设备的任务编排、IO交互与低延迟执行能力,TT-Ascalon S专为这一场景优化升级。该产品基于TT-Ascalon X迭代研发,芯片尺寸缩小约50%,单位面积性能提升140%,兼具高密度、高能效、低延迟三大优势。
能效与延迟优化上,TT-Ascalon S采用紧凑节能设计,适配高吞吐量AI执行层部署;同时针对智能体典型的混合运算、分支密集、工具高频连接的运行模式深度调优,可实现可预测的稳定执行,大幅降低智能体交互延迟。除智能体AI外,该产品还可广泛应用于高效服务器、网络存储SoC、数据中心边缘等场景,且支持IP授权模式,允许客户基于该架构开展定制化芯片设计,灵活性极高。
此外,Tenstorrent表示,此前推出的TT-Ascalon系列高性能RISC-V CPU,已是行业顶尖水平的RISC-V CPU IP产品。该芯片全面兼容RVA23规范与RVV1.0矢量引擎,支持硬件虚拟化、高级内存管理、安全防护与RAS可靠性运维功能,经SPEC CPU权威基准测试验证,SPECint®2006/GHz超22、SPECint®2017/GHz超2.3、SPECfp®2017/GHz超3.6,在三星SF4X工艺节点下主频可达2.5GHz以上,性能比肩高端专属架构处理器,可覆盖服务器、AI基础设施、车载HPC、ADAS等多场景。
生态布局方面,Tenstorrent已完成GCC、LLVM、Qemu三大主流工具链的全线适配并完成上游提交,开发者可快速部署适配RVA23规范的软件,保障生态兼容性。同时,Tenstorrent推出创新IP许可计划,助力企业自主持有、定制化改造核心算力IP,并联合CoreLab搭建区域服务体系,为客户提供设计优化、落地适配、规模化部署的全流程支持。
Jim Keller在此前接受采访时表示,AI芯片竞争已经不再是单点算力的比拼,而是系统架构、成本结构与生态能力的全面竞争,Tenstorrent将全面击败晶圆级AI芯片厂商Cerebras,并且拒绝被收购,会以IPO为目标努力。
Tenstorrent目前已经收到了硬件订单,其中最大的采购订单是一个96台Galaxy集群(即3072颗Blackhole芯片),将发往美国以外的地区。Tenstorrent迄今为止最大的客户是日本的AI&。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
