B体育(Bsports)官方网站

B体育你的位置:B体育(Bsports)官方网站 > B体育 > B体育(Bsports) 硅谷深陷算力荒:H200今夜加价30%,H100抢到缺货,Karpathy也未能避免

B体育(Bsports) 硅谷深陷算力荒:H200今夜加价30%,H100抢到缺货,Karpathy也未能避免

发布日期:2026-05-25 03:15    点击次数:192

B体育(Bsports) 硅谷深陷算力荒:H200今夜加价30%,H100抢到缺货,Karpathy也未能避免

作家 | 四月

2026 年 5 月的硅谷,关于 AI 算力的“饥馑”和狞恶,正达到一个前所未有的高度。

哪怕那些站在算力中心的东说念主,也不得不运行径算力列队。

在英伟达,讲求应用深度学习经营团队的 Bryan Catanzaro 找黄仁勋央求试验卡。最近行家一直衔恨卡不够用,受限太多。

“不好意义,那些卡还是卖掉了”,这是老黄给出的恢复。

Catanzaro 是英伟达的大元勋。十多年前,恰是他属意到,GPU 迎来了首批 AI 买家——经营员,且简直豪恣扫货。基于这个瞻念察,老黄才下定决心把整间公司押注 AI 赛说念。

当年帮英伟达赌对算力卡的东说念主,咫尺却买不到自家的 GPU 了。

而比“卖铲子的没铲子了”更戏剧性的事,还发生在谷歌。

旧年夏天,DeepMind 的经营员 Andrew Dai 判断,视觉推理是个值得作念的场地。于是向公司里面提了一批 TPU 的资源需求。

张开剩余93%

但央求迟迟未批。拒却的情理,倒不是经营场地不够好,而是名目弗成为下一代的 Gemini 劳动。其时的里面原则是,资源应该优先流向付费客户和旗舰模子。

“在谷歌里面,每一块 TPU 的背后,都有三位竞争者”,华盛顿大学计较机系的荣誉教师 Oren Etzioni 聊到。施行很惨酷,要是你的名目弗成平直带来收入,你便是在和付费客户抢资源。

Dai 最终接纳下野创业。和他作念出一样接纳的,还有 Anna Goldie。

意义意义的是,谷歌用来遮挽 Goldie 的筹码不是加薪,也不是期权,而是——更多的 TPU 算力卡。

但 Goldie 如故走了,还拿到了 3.35 亿好意思元的融资,“这笔钱能买到的算力,和当初 DeepMind 遮挽我开出的条目,简直格外。”

当大厂围墙内的算力酿成一种“组织权限”,出走就成了唯独解。

而在围墙除外,孤苦成就者和经营员面对的,是比“GPU 短缺”更难的处境:连卡都租不到。

这事还是关键到什么进度了呢?

这两天,AI 大神 Andrej Karpathy 都忍不住发帖吐槽。他暗意,在录制 nanochat 素质视频时,才一刹意志到,要是实验的第一步是,让学员“从云平台览动一台 8×H100 的劳动器”,那么绝大部分东说念主将倒在起跑线上。

有大神出来喊话,驳斥区赶紧酿成大型比惨现场。

1H100 抢不到,H200 今夜加价 30%

看这话问得,昭着是本人盟军无疑了。

有东说念主补刀,其实果真的第一步,还不是启动 Server,而是求爷爷告奶奶等 quota approval。 咫尺大广泛的鄙俗用户,是连 8×H100 的预审批权限都莫得的。

更有成就者平直晒后台截图:RunPod 上多种 GPU 型号败露 unavailable;Azure 上 H100 编造机启动失败,请示 capacity 不及;Google Colab 接纳 GPU 后,被系统自动降档到 G4。

Rohan Bansal 看着账户里仅存的两个 H100 实例,发了条推文:“holding on for dear life”。

要是说资源紧缺势必导致价钱高潮,尚可结合。但这加价的姿势难免也有些诡异。

平常的逻辑是,新一代出来,旧款降价。B200 还是领会供货,四年前的 H100 也理当降价。

现货市集更夸张,lambda 的报价已上浮到 4 好意思元 +/ 小时,是两年前的两倍。而 H200 的现货价钱以至比新一代 B200 还要贵。"这价钱是两年前的两倍还多,况兼频繁很难抢到,要写剧本盯着 API 才有契机。"

图注:从 4.96 好意思元 / 小时涨到 6.40 好意思元 / 小时,涨幅 29%;而更新一代的 B200 为 5.68 好意思元 /GPU 小时。

25% 的运用率和 B200 的倒挂

一边是高端 GPU 紧缺,一边却是算力中心里的运用率低得令东说念主发指。

Cast AI 的敷陈败露,不少大企业 GPU 集群的平均运用率只须 5% 傍边。此前,马斯克的兆瓦级算力中心 Colossus 的 MFU(模子算力运用率)仅为 11% 傍边。

其实并不是企业意志到不到算力资源的铺张,而是不敢甘休。

列队几个月,云厂商销售一刹打电话:“你要的卡咫尺只剩 36 张了,只可签一年的长约。不要的话,B体育(Bsports)官方网站背面还有五家列队等着呢。”

这时刻,问题还是不是“公司是否需要租用这样万古刻的芯片”,而是“我敢不敢错过这笔订单”。

先签下来,哪怕闲置也不开释,因为交出去的算力卡可能就再也拿不归来了。

芯片不仅仅产能短缺,更是流动性短缺:它卡在企业的算力长约里,困在云厂商的容量池里,但便是不在鄙俗成就者今晚能点开购买的页面上。

短缺制造畏俱,畏俱制造囤积,囤积制造更深的短缺。

而这种流动性的繁难,也放大了另一个结构性问题:为什么偏巧是 H100/H200 被推上了天价,以至比新一代 B200 还贵?

因为算力市集从来不是按“谁更新”来订价,而是按“谁更好用、更好接入”来订价的。

昔时行家抢 GPU,念念象中的场景是巨头试验下一代大模子,虽然要追求极致先进。但咫尺,破费 GPU 的地方变多了:推理劳动、代码 Agent、RL 后试验、自动评测、小模子复现、素质实验,都在执续吃算力。

关于这些海量需求来说,B200 代表的下一代性能上限并不是首选。

作念工程的东说念主最懂:开首进不等于最佳用,真刚巧钱的是详情味。

H100/H200 鼓胀强,且生态鼓胀练习。你用 H100 跑,别东说念主的 benchmark 亦然 H100;你用 H200 作念推理,调参告诫还是有东说念主踩过坑。

比拟之下,新一代芯片再强,也需要时刻消化到框架、集群、调整和本钱模子里。

试验市集还没王人备切到 Blackwell,推理和后试验市集又把需求重重复加上来。旧卡本该退场,却因为“详情味”成了刚需。

3AI 民主化,卡在了算力门槛上

这一轮的芯片荒,和昔时还不太一样。

昔时聊缺芯,是顶级 AI Lab 的武备竞赛,巨头谁抢到更多 GPU,谁就能试验更大模子。但这一次,狞恶正在往下千里。

Karpathy 录教程要先酌量成就者能弗成拿到 8×H100;LocalLLaMA 社区征询能弗成用土产货 Mac 硬跑;高校经营员记念拿不到算力,小团队记念扩容被大客户挤掉。

PC加拿大(中国)官方网站

这背后还是不是“我要试验 GPT-5”的贪心,而是一个更朴素的问题:我仅仅念念复现一个实验,为什么第一步就酿成抢算力了?

AI 开源这几年确乎裁汰了许多门槛。模子权重不错下载,代码不错 fork。但算力把另一扇门关上了。

代码不错开源,但 H100 弗成 fork。

果真的 AI 经营从来不仅仅看懂代码,还得你能跑通实验、复现效力,调参、失败,以及许屡次的再重来。

要是每次实验的前提,都是拿到一组沸腾且不领会的 GPU,那么开源的对等,就会被算力的不对等再行对消。

从 Google 经营员下野创业,到英伟达里面争 GPU,然后是 Karpathy 的素质视频卡在 8 张 H100,它们指向并吞件事:算力正在从基础次第,酿成一种筛选机制。

它筛掉的无意是莫得念念法的东说念主,而是莫得预算、莫得配额资源、莫得永远公约的群体。

这才是 AI 民主化最莫名的施行:模子越来越洞开,但能跑起来的东说念主,可能并莫得变多。

4国内成就者的痛:过渡期的双重压力

把视野拉归国内,要是说国外成就者是在练习生态里抢 H100/H200 现货;那么国内成就者面对的,则是过渡期的多重压力练习,要在新的算力结构里找"能用且好用"的解法。

某云 H100 排期已到 2027 年第一季度,更多的云平台一样濒临高端卡供应瓶颈,"有钱也租不到"是真实的用户反映。

与此同期,高端卡的取得仍然受策略影响,虽然国产算力替代正在加快。但从 CUDA 体系切换的工程本钱是真实存在的,适配层、代码改换、调试周期,对小团队而言不是应付的迁徙。

其实,行家底层的处境不尽相易。算力底座从来不是一个重大词,而口角常具体的体验——实例能弗成启动,价钱扛不扛得住,实验效力能弗成复现。

今天 AI 圈果真稀缺的,也许不是最新的芯片,而是鄙俗东说念主能领会拿到、立地用起来、跑出效力的灵验算力。

参考连络:

Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power(https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/)

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index(https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity)

FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing( https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing )

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance( https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance )

Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power(https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/)

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index(https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity)

FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing( https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing )

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance( https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance )

声明:本文为 AI 前哨原创,不代表平台不雅点B体育(Bsports),未经许可退却转载。

发布于:北京市

Copyright © 1998-2026 B体育(Bsports)官方网站™版权所有

hcymagnet.com备案号 备案号: 

技术支持:®B体育 RSS地图 HTML地图

top