B体育(Bsports) 硅谷深陷算力荒：H200今夜加价30%，H100抢到缺货，Karpathy也未能避免

发布日期：2026-05-25 03:15 点击次数：192

作家｜四月

2026 年 5 月的硅谷，关于 AI 算力的“饥馑”和狞恶，正达到一个前所未有的高度。

哪怕那些站在算力中心的东说念主，也不得不运行径算力列队。

在英伟达，讲求应用深度学习经营团队的 Bryan Catanzaro 找黄仁勋央求试验卡。最近行家一直衔恨卡不够用，受限太多。

“不好意义，那些卡还是卖掉了”，这是老黄给出的恢复。

Catanzaro 是英伟达的大元勋。十多年前，恰是他属意到，GPU 迎来了首批 AI 买家——经营员，且简直豪恣扫货。基于这个瞻念察，老黄才下定决心把整间公司押注 AI 赛说念。

当年帮英伟达赌对算力卡的东说念主，咫尺却买不到自家的 GPU 了。

而比“卖铲子的没铲子了”更戏剧性的事，还发生在谷歌。

旧年夏天，DeepMind 的经营员 Andrew Dai 判断，视觉推理是个值得作念的场地。于是向公司里面提了一批 TPU 的资源需求。

张开剩余93%

但央求迟迟未批。拒却的情理，倒不是经营场地不够好，而是名目弗成为下一代的 Gemini 劳动。其时的里面原则是，资源应该优先流向付费客户和旗舰模子。

“在谷歌里面，每一块 TPU 的背后，都有三位竞争者”，华盛顿大学计较机系的荣誉教师 Oren Etzioni 聊到。施行很惨酷，要是你的名目弗成平直带来收入，你便是在和付费客户抢资源。

Dai 最终接纳下野创业。和他作念出一样接纳的，还有 Anna Goldie。

意义意义的是，谷歌用来遮挽 Goldie 的筹码不是加薪，也不是期权，而是——更多的 TPU 算力卡。

但 Goldie 如故走了，还拿到了 3.35 亿好意思元的融资，“这笔钱能买到的算力，和当初 DeepMind 遮挽我开出的条目，简直格外。”

当大厂围墙内的算力酿成一种“组织权限”，出走就成了唯独解。

而在围墙除外，孤苦成就者和经营员面对的，是比“GPU 短缺”更难的处境：连卡都租不到。

这事还是关键到什么进度了呢？

这两天，AI 大神 Andrej Karpathy 都忍不住发帖吐槽。他暗意，在录制 nanochat 素质视频时，才一刹意志到，要是实验的第一步是，让学员“从云平台览动一台 8×H100 的劳动器”，那么绝大部分东说念主将倒在起跑线上。

有大神出来喊话，驳斥区赶紧酿成大型比惨现场。

1H100 抢不到，H200 今夜加价 30%

看这话问得，昭着是本人盟军无疑了。

有东说念主补刀，其实果真的第一步，还不是启动 Server，而是求爷爷告奶奶等 quota approval。咫尺大广泛的鄙俗用户，是连 8×H100 的预审批权限都莫得的。

更有成就者平直晒后台截图：RunPod 上多种 GPU 型号败露 unavailable；Azure 上 H100 编造机启动失败，请示 capacity 不及；Google Colab 接纳 GPU 后，被系统自动降档到 G4。

Rohan Bansal 看着账户里仅存的两个 H100 实例，发了条推文：“holding on for dear life”。

要是说资源紧缺势必导致价钱高潮，尚可结合。但这加价的姿势难免也有些诡异。

平常的逻辑是，新一代出来，旧款降价。B200 还是领会供货，四年前的 H100 也理当降价。

现货市集更夸张，lambda 的报价已上浮到 4 好意思元 +/ 小时，是两年前的两倍。而 H200 的现货价钱以至比新一代 B200 还要贵。"这价钱是两年前的两倍还多，况兼频繁很难抢到，要写剧本盯着 API 才有契机。"

图注：从 4.96 好意思元 / 小时涨到 6.40 好意思元 / 小时，涨幅 29%；而更新一代的 B200 为 5.68 好意思元 /GPU 小时。

25% 的运用率和 B200 的倒挂

一边是高端 GPU 紧缺，一边却是算力中心里的运用率低得令东说念主发指。

Cast AI 的敷陈败露，不少大企业 GPU 集群的平均运用率只须 5% 傍边。此前，马斯克的兆瓦级算力中心 Colossus 的 MFU（模子算力运用率）仅为 11% 傍边。

其实并不是企业意志到不到算力资源的铺张，而是不敢甘休。

列队几个月，云厂商销售一刹打电话：“你要的卡咫尺只剩 36 张了，只可签一年的长约。不要的话，B体育(Bsports)官方网站背面还有五家列队等着呢。”

这时刻，问题还是不是“公司是否需要租用这样万古刻的芯片”，而是“我敢不敢错过这笔订单”。

先签下来，哪怕闲置也不开释，因为交出去的算力卡可能就再也拿不归来了。

芯片不仅仅产能短缺，更是流动性短缺：它卡在企业的算力长约里，困在云厂商的容量池里，但便是不在鄙俗成就者今晚能点开购买的页面上。

短缺制造畏俱，畏俱制造囤积，囤积制造更深的短缺。

而这种流动性的繁难，也放大了另一个结构性问题：为什么偏巧是 H100/H200 被推上了天价，以至比新一代 B200 还贵？

因为算力市集从来不是按“谁更新”来订价，而是按“谁更好用、更好接入”来订价的。

昔时行家抢 GPU，念念象中的场景是巨头试验下一代大模子，虽然要追求极致先进。但咫尺，破费 GPU 的地方变多了：推理劳动、代码 Agent、RL 后试验、自动评测、小模子复现、素质实验，都在执续吃算力。

关于这些海量需求来说，B200 代表的下一代性能上限并不是首选。

作念工程的东说念主最懂：开首进不等于最佳用，真刚巧钱的是详情味。

H100/H200 鼓胀强，且生态鼓胀练习。你用 H100 跑，别东说念主的 benchmark 亦然 H100；你用 H200 作念推理，调参告诫还是有东说念主踩过坑。

比拟之下，新一代芯片再强，也需要时刻消化到框架、集群、调整和本钱模子里。

试验市集还没王人备切到 Blackwell，推理和后试验市集又把需求重重复加上来。旧卡本该退场，却因为“详情味”成了刚需。

3AI 民主化，卡在了算力门槛上

这一轮的芯片荒，和昔时还不太一样。

昔时聊缺芯，是顶级 AI Lab 的武备竞赛，巨头谁抢到更多 GPU，谁就能试验更大模子。但这一次，狞恶正在往下千里。

Karpathy 录教程要先酌量成就者能弗成拿到 8×H100；LocalLLaMA 社区征询能弗成用土产货 Mac 硬跑；高校经营员记念拿不到算力，小团队记念扩容被大客户挤掉。

PC加拿大(中国)官方网站

这背后还是不是“我要试验 GPT-5”的贪心，而是一个更朴素的问题：我仅仅念念复现一个实验，为什么第一步就酿成抢算力了？

AI 开源这几年确乎裁汰了许多门槛。模子权重不错下载，代码不错 fork。但算力把另一扇门关上了。

代码不错开源，但 H100 弗成 fork。

果真的 AI 经营从来不仅仅看懂代码，还得你能跑通实验、复现效力，调参、失败，以及许屡次的再重来。

要是每次实验的前提，都是拿到一组沸腾且不领会的 GPU，那么开源的对等，就会被算力的不对等再行对消。

从 Google 经营员下野创业，到英伟达里面争 GPU，然后是 Karpathy 的素质视频卡在 8 张 H100，它们指向并吞件事：算力正在从基础次第，酿成一种筛选机制。

它筛掉的无意是莫得念念法的东说念主，而是莫得预算、莫得配额资源、莫得永远公约的群体。

这才是 AI 民主化最莫名的施行：模子越来越洞开，但能跑起来的东说念主，可能并莫得变多。

4国内成就者的痛：过渡期的双重压力

把视野拉归国内，要是说国外成就者是在练习生态里抢 H100/H200 现货；那么国内成就者面对的，则是过渡期的多重压力练习，要在新的算力结构里找"能用且好用"的解法。

某云 H100 排期已到 2027 年第一季度，更多的云平台一样濒临高端卡供应瓶颈，"有钱也租不到"是真实的用户反映。

与此同期，高端卡的取得仍然受策略影响，虽然国产算力替代正在加快。但从 CUDA 体系切换的工程本钱是真实存在的，适配层、代码改换、调试周期，对小团队而言不是应付的迁徙。

其实，行家底层的处境不尽相易。算力底座从来不是一个重大词，而口角常具体的体验——实例能弗成启动，价钱扛不扛得住，实验效力能弗成复现。

今天 AI 圈果真稀缺的，也许不是最新的芯片，而是鄙俗东说念主能领会拿到、立地用起来、跑出效力的灵验算力。

参考连络：

Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power（https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/）

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index（https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity）

FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing（ https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing ）

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance（ https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance ）

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index（https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity）

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance（ https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance ）

声明：本文为 AI 前哨原创，不代表平台不雅点B体育(Bsports)，未经许可退却转载。

发布于：北京市

上一篇：b体育官方app下载雷迪克：积极进犯中的猖獗不错罗致散逸被迫导致的猖獗则不能取

下一篇：b体育官方app下载西安：无东说念主机足球点亮青少年科学梦

B体育(Bsports) 硅谷深陷算力荒：H200今夜加价30%，H100抢到缺货，Karpathy也未能避免

友情链接：