2025年20+ AI芯片制造商

来源:半导纵横发布时间:2025-02-06 09:34
AI
英伟达
生成海报
AI市场,热闹非凡。

根据笔者在 4 种不同场景中使用 10 种不同的 GPU 模型运行 AIMultiple云 GPU 基准测试的经验,以下是数据中心工作负载的顶级 AI 硬件公司。

20+ 家 AI 芯片制造商(按类别划分)

这些芯片制造商专注于数据中心芯片:

按类别排序。供应商按前 3 个类别(即领先生产商、公共云、公共 AI 云)内的估计市场份额进行排名,因为可以估算销售量或云使用量。后 3 个类别(即 AI 初创公司、新兴生产商、其他生产商)中的供应商按字母顺序排序。

5家移动AI芯片提供商

5家边缘 AI 芯片

低延迟处理的需求推动了边缘 AI 芯片的创新。这些芯片的处理器旨在在设备上本地执行 AI 计算,而不是依赖基于云的解决方案:

领先的 AI 芯片生产商有哪些?

1. 英伟达

NVIDIA 自 1990 年代以来一直为游戏领域设计图形处理单元 (GPU)。NVIDIA 是一家无晶圆厂芯片制造商,其大部分芯片制造外包给台积电。其主要业务包括:

图形处理单元 (GPU)

PlayStation 3 和 Xbox 都使用 NVIDIA 图形阵列。

NVIDIA 针对零售用户的 GPU 包括 GeForce 系列。

桌面人工智能解决方案

Project Digits 是面向 AI 工程师和数据科学家的桌面 AI 解决方案,其计划:

· 成本 3,000 美元。

· 尺寸与 Mac mini 差不多,配备 128GB 内存。

· 处理高达 2000 亿个参数的模型的 LLM 推理和微调。

数据中心解决方案

该公司继 Ampere、Hopper 和最近的 Blackwell 架构之后,开始生产 AI 芯片。得益于生成式 AI 的蓬勃发展,NVIDIA 在过去几年中取得了优异的成绩,估值达到万亿美元,巩固了其在 GPU 和 AI 硬件市场的领先地位。

NVIDIA 的芯片组旨在解决各行各业的业务问题。DGX A100 和 H100 是 Nvidia 成功的旗舰 AI 芯片,专为数据中心的 AI 训练和推理而设计。NVIDIA 随后跟进:

H200、B300 和 GB300 芯片。

HGX 服务器,例如 HGX H200 和 HGX B300,集成了 8 个这样的芯片。

NVL 系列和 GB200 SuperPod 将更多芯片组合成更大的集群。

云 GPU

凭借其数据中心产品的实力,NVIDIA 几乎垄断了云端 AI 市场,大多数云端玩家仅提供 NVIDIA GPU 作为云 GPU。

NVIDIA 还推出了DGX Cloud产品,绕过云提供商直接向企业提供云 GPU 基础设施。

最新动态

DeepSeek R1 的发布表明,最先进的模型可以用相对较少的 GPU 进行训练。这导致 NVIDIA 股价下跌。虽然这不是投资建议,但对 NVIDIA 来说这可能是积极的,因为计算能力提供的效用越多,它应该被更广泛地使用(即杰文斯悖论)。

然而,考虑到由于芯片设计和互连的改进,GPU 系统的性能每年都会提高数倍,买家最好不要购买超出其年度需求的产品,因为这可能导致拥有过时或性能不佳的系统。

2. AMD

AMD是一家无晶圆厂芯片制造商,拥有CPU、GPU和AI加速器产品。

AMD 于 2023 年 6 月推出了用于 AI 训练工作负载的 MI300,并与 NVIDIA 争夺市场份额。由于 ChatGPT的推出引发了生成式 AI 的兴起,导致 Nvidia AI 硬件需求迅速增加,因此 Nvidia AI 硬件很难采购,因此许多初创公司、研究机构、企业和科技巨头在 2023 年都采用了AMD硬件。

AMD 将推出 MI350 系列来取代 MI300,与 NVIDIA 的 H200 竞争。AMD 声称另一款最新芯片 MI325X 具有市场领先的推理性能。AMD 还与 Hugging Face 等机器学习公司合作,以使数据科学家能够更高效地使用他们的硬件。

软件生态系统至关重要,因为硬件性能在很大程度上依赖于软件优化。例如,AMD 和 NVIDIA 在对 H100 和 MI300 进行基准测试方面存在公开分歧。分歧的焦点是基准测试中使用的软件包和浮点。根据最新的基准测试,MI300 在 70B LLM 上的推理性能似乎优于或与 H100 相当。

软件

虽然 AMD 硬件正在追赶 NVIDIA,但其软件在可用性方面却落后。虽然 CUDA 可以立即用于大多数任务,但 AMD 软件需要大量配置。

生态系统

与 NVIDIA 一样,AMD 也在有选择地投资其解决方案的用户,以推动其硬件的采用。

3.英特尔

英特尔是 CPU 市场最大的参与者,拥有悠久的半导体开发历史。与 NVIDIA 和 AMD 不同,英特尔使用自己的代工厂来制造芯片。

Gaudi3是英特尔最新的AI加速器处理器。然而,英特尔对 2024 年 Gaudi3 的销售预期约为 5 亿美元,与 AMD 预计在 2024 年赚取的数十亿美元相比要低得多。

英特尔正面临治理问题,其首席执行官帕特·基辛格 (Pat Gelsinger) 于 2024 年 12 月离职就是明证。英特尔董事会成员中相当一部分缺乏以运营方式领导半导体公司的经验。在CEO离职后,英特尔在AI和代工市场的战略尚不明朗。

哪些公有云供应商生产AI芯片?

4. AWS

AWS 生产用于模型训练的 Tranium 芯片和用于推理的 Inferentia 芯片。尽管 AWS 是公有云市场的领导者,但它在谷歌之后才开始打造自己的芯片。

5. Google云平台

Google Cloud TPU 是一款专用的机器学习加速器芯片,为 Google 翻译、照片、搜索、助手和 Gmail 等产品提供支持。它也可以通过 Google Cloud 使用。Google 于 2016 年宣布推出 TPU。新的TPU是Trillium,第六代TPU。

Google Alphabet 的另一款加速器芯片 Edge TPU 比一分硬币还小,专为智能手机、平板电脑和物联网设备等边缘设备而设计。

6.阿里巴巴

阿里巴巴生产了含光800等用于推理的芯片。

7. IBM

IBM将于2022年发布最新的深度学习芯片——人工智能单元(AIU)。IBM正在考虑使用这些芯片为其watson.x生成式AI平台提供支持。

AIU 以“ IBM Telum 处理器”为基础,为 IBM Z 大型机服务器的 AI 处理功能提供支持。在发布时,Telum 处理器的突出用例包括欺诈检测。

IBM 还证明了计算和内存的融合可以提高效率。这些在 NorthPole 处理器原型中得到了证明。

8. 华为

华为海思Ascend 910C是该公司2019年推出的用于AI训练的Ascend 910处理器版本。

哪些云端 AI 提供商生产自己的芯片?

这些提供商没有像超大规模提供商那样拥有全面功能的公共云。他们提供有限的云服务,通常专注于 AI 推理。

9. Groq

Groq 由前谷歌员工创立。该公司代表 LPU,一种新的 AI 芯片架构模型,旨在让公司更容易采用其系统。这家初创公司已经筹集了约 3.5 亿美元,并生产了其首批模型,例如 GroqChip 处理器、GroqCard 加速器等。

该公司专注于 LLM 推理,并发布了 Llama-2 70B 的基准测试。

2024 年第一季度,该公司表示,有 7 万名开发人员在其云平台上注册,并构建了 1.9 万个新应用程序。

2022 年 3 月 1 日,Groq 收购了 Maxeler,后者为金融服务提供高性能计算 (HPC) 解决方案。

10. SambaNova Systems

SambaNova Systems 成立于 2017 年,旨在开发用于大量生成式 AI 工作负载的高性能、高精度硬件软件系统。该公司开发了SN40L 芯片并筹集了超过 11 亿美元的资金。

值得注意的是,SambaNova Systems 也将其平台租赁给企业。SambaNova Systems 的 AI 平台即服务方法使其系统更易于采用,并鼓励硬件重复使用以实现循环经济。

领先的 AI 芯片初创公司有哪些?

本文还想介绍一些AI芯片行业的初创公司,这些公司的名字在不久的将来可能会被经常听到。尽管这些公司成立不久,但它们已经筹集了数百万美元。

11.Cerebras

Cerebras 成立于 2015 年,是唯一一家专注于晶圆级芯片的大型芯片制造商。晶圆级芯片由于内存带宽较高,在并行性方面比 GPU 更具优势。然而,设计和制造此类芯片是一项新兴技术。

Cerebras 芯片包括:

· WSE-1 拥有 1.2 万亿个晶体管和 40 万个处理核心。

· WSE-2 拥有 2.6 万亿个晶体管和 85 万个内核,于 2021 年 4 月发布。它采用了台积电的 7nm 工艺。

· WSE-3 拥有 4 万亿个晶体管和 90 万个 AI 核心,于 2024 年 3 月发布。它利用台积电的 5nm 工艺。

Cerebras 还在其云端向企业提供芯片。

12. d-Matrix

d-Matrix 采用一种新颖的方法,摒弃了传统的冯·诺依曼架构,转而采用内存计算。虽然这种方法有可能解决内存和计算之间的瓶颈问题,但它是一种新方法,尚未得到证实。

13.Rebellions

Rebellions 与另一家韩国半导体设计公司 SAPEON 合并,并于 2024 年达到独角兽估值。

14.Tentorrent

Tenstorrent 生产 Wormhole 芯片、供研究人员使用的台式机以及采用 Wormhole 芯片的服务器(例如 Tenstorrent Galaxy)。该公司还为其解决方案提供软件堆栈。

2024 年 12 月,Tenstorrent 从杰夫·贝佐斯 (Jeff Bezos) 等投资者手中筹集了 7 亿美元,估值超过 26 亿美元。

15.Etched

Etched提供了一种不同的创作方法,类似于生产用于采矿的 ASIC——专门从事特定类型的生成 AI,即所谓的变压器。这些芯片不会与其他型号兼容,但与特定型号相比,性能会高出几个数量级。所展示的 Sohu 处理器与 Llama 70B 兼容,每秒可处理 50 万个代币。配备 8 个 Sohu 芯片的服务器可以替代 160 个 NVIDIA H100 处理器。

据 Etched 介绍,Sohu 是首款专门用于 Transformer 模型的芯片。其性能远高于任何现有的通用解决方案,但无法运行 CNN、LSTM、SSM 或任何其他 AI 模型。它采用台积电的 4 纳米工艺制造。

新兴的 AI 硬件生产商有哪些?

虽然这些都是引人注目的人工智能硬件解决方案,但由于它们是市场上的新产品,因此目前对其有效性的基准有限。

16.苹果

据报道,苹果的 ACDC 项目专注于构建用于 AI 推理的芯片。苹果已经是一家主要的芯片设计公司,其内部设计的半导体被用于 iPhone、iPad 和 Macbook。

17.Meta

Meta 训练和推理加速器 (MTIA) 是用于 AI 工作负载(例如训练 Meta 的 LLaMa 模型)的处理器系列。

最新型号是下一代 MTIA,它基于台积电 5nm 技术,据称与 MTIA v1 相比性能提高了 3 倍。MTIA 将托管在最多包含 72 个加速器的机架中。

MTIA 目前供 Meta 内部使用。但是,如果 Meta 将来推出基于 LLaMa 的企业生成式 AI产品,这些芯片可以为该产品提供支持。

18.微软 Azure

微软将于 2023 年 11 月推出 Maia AI 加速器。

19.OpenAI

OpenAI 与博通和台积电合作打造了其首款 AI 芯片。OpenAI 芯片团队的领导层曾在谷歌设计 TPU。

其他 AI 芯片生产商有哪些?

20. Graphcore

Graphcore 是一家成立于 2016 年的英国公司。该公司宣布其旗舰 AI 芯片为 IPU-POD256。Graphcore 已获得约 7 亿美元的融资。

公司与 DDN、Pure Storage 和 Vast Data 等数据存储公司建立了战略合作伙伴关系。Graphcore 的 AI 芯片服务于牛津曼量化金融研究所、布里斯托大学和加州大学伯克利分校等研究机构。

21.Mythic

Mythic 成立于 2012 年,专注于边缘 AI。Mythic 走的是一条非传统的道路,即模拟计算架构,旨在提供节能的边缘 AI 计算。

该公司开发了M1076 AMP、MM1076钥匙卡等产品,并已筹集约1.65亿美元的资金。Mythic 于 2023 年 3 月通过一轮融资解雇了大部分员工并重组了业务。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论