全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

新智元报道

编辑:编辑部

【新智元导读】两天前,马斯克得意自曝:团队仅用122天,就建成了10万张H100的Colossus集群,未来还会扩展到15万张H100和5万张H200。此消息一出,奥特曼都被吓到了:xAI的算力已经超过OpenAI了,还给员工承诺了价值2亿期权,这是要上天?

马斯克的xAI一路狂飙突进,把Sam Altman都整怕了!

就在9月3日,马斯克在推上得意自曝:

团队仅仅用了122天时间,就建成了有10万张H100的Colossus集群,是世界上最强大的AI训练系统。

而且,未来几个月规模还要翻一倍,扩展到15万张H100+5万张H200。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

最后,马斯克感谢了英伟达和许多其他合作伙伴、供应商。据悉,是戴尔开发、组装了Colossus系统。

马斯克的xAI,已经让几大AI巨头感受到了强烈的威胁。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

根据内幕消息,Sam Altman就曾表示,自己是怕了马斯克了!

如今的xAI,不光算力有超越OpenAI之势,还对员工十分大方。有说法指出,对于xAI的研究者,马老板曾承诺过价值2亿美元的期权。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

马斯克,全力进军超算

相信大家都已经发现:马斯克的超算野心,是愈发藏不住了!

隔三岔五的,就会有劲爆消息曝出。

7月底,xAI启动了位于孟菲斯的超级AI集群的训练,该集群由十万个液冷H100 GPU组成。

十万个H100 GPU消耗的电力大约在70兆瓦,因此这个超算至少会消耗150兆瓦的电力。

8月底,特斯拉宣布了Cortex AI集群,包括5万个英伟达H100 GPU,和2万个特斯拉的Dojo AI晶圆级芯片。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

如今看来,这些集群很可能都正式投入运行,甚至已经在训练AI模型了。

不过,马斯克真的有能力让它们全部在线吗?

首要问题是,要调试和优化这些集群的设置,需要一定时间。

其次,xAI还得确保它们获得足够的电力。

我们知道,虽然马斯克的公司一直在用14台独立发电机为其供电,但要为十万块H100 GPU供电,这些电力显然不够。

训练xAI的Grok 2,需要两万块H100;而马斯克预测,要训练Grok 3,可能会需要十万块H100。

所以,xAI的数据中心,建得怎么庞大都不过分。

建设速度太快,推测是「部分上线」

122天,也就是4个月的时间,建成10万张H100组成的超算集群,这是个什么速度?

有业内人士表示,通常完成这样一个集群可能需要一年时间。

这个速度,这个规模,很马斯克。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

但也有人猜测,他可能有夸大其词的倾向,高估了在单一集群中实际运行的GPU数量。

囤足10万张芯片、放在一起共同运行,并不意味着就是单一集群。

论GPU数量,Meta在今年1月就已经计划采购35万张H100,但实际运行时是分成了不同集群。

之所以还没有其他公司能造出10万GPU规模的集群,很难说是因为缺钱,更重要的因素是网络解决方案。

串联起所有GPU的网络,需要保证足够的高带宽、低延迟和可靠性,才能让10万张芯片协同起来像一台计算机一样工作。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

Colossus是二战期间第一台可编程计算机,也曾在科幻电影里登场

除了网络,还有电力问题。

马斯克此前表示,Colossus在6月底已经启动运行,当时,电力公司供应的最高功率只有几兆瓦,仅能供应数千个GPU同时运行。

电力公司表示,到8月,xAI将获得大约50兆瓦的电力,但这只能供应大约5万个芯片。

与此同时,现场即将建成的另一个发电站将提供另外150兆瓦,可以满足10万个或更多芯片的电力需求,但要到明年才能实现。

马斯克似乎找到了一个短期解决方案:引入化石能源发电机。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

Colossus所在地,田纳西州孟菲斯的环保组织前几天刚刚写信控诉马斯克,指责他在没有许可的情况下安装了至少18台涡轮机(可能更多),加剧了当地的空气污染。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

出于网络和电力两方面的限制因素,The Information指出,马斯克的这个集群可能只是「部分完成」

除了Colossus和微软在凤凰城为OpenAI建造的超算集群,多个类似的集群也正处在研发和建设过程中。

奥特曼:微软爸爸,我们的算力不够了

尽管如此,马斯克这个超大集群的进展,还是让一些竞争对手极度担心!

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

其中一位,就是OpenAI的CEO Sam Altman。

根据内部消息,奥特曼已经向一些微软高管透露了自己的担忧——

他十分担心,xAI很快就拥有比OpenAI更多的算力!

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

虽然为OpenAI提供算力的微软老大哥,资金实力非常雄厚,但作为上市公司,微软在花费资金时,还需要对公众股东负责。

但马斯克则完全没有这样的限制,尽管他的资金不如微软。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

甭管马斯克有多少吹牛的成分,即使能部分完成Colossus集群的建成,也是一件令人印象深刻的事。

外媒The Information猜测,马斯克这种神奇的赶工速度,是否放弃了传统的例行安全检查?

毕竟,如果按例检查的话,可能会让数据中心项目的竣工延迟数月。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

而且,The Information还发现了一个「华点」:Colossus位于以前的制造工厂内,这可不是适合高性能计算的理想场所。

微软和英伟达的高管透露,这是他们最不愿意放置昂贵硬件的地点之一。

因为这些地方很难改造,来适应服务器耗费的巨大电量,和数据中心设备需要的冷却技术。

咱们都知道,马老板一向喜欢突破边界,而在质疑声纷至沓来时,他又经常被证明是正确的。

最近在xAI的姊妹公司X,马斯克又有了一个惊人之举:关闭了一个数据中心。

当时大家都担心,X会因此而崩溃。结果谁也没想到,X运行得很好,马斯克居然有如此先见之明。

而这次,马斯克在田纳西州的超算,也同样可能会对AI开发者振聋发聩——

或许他们会发现,传统的做事方式如今已经过时了。

两家神秘AI巨头,正计划打造1250亿美元超算

如今,数据中心之战,竞争还在火热加剧!至少有六大巨头,已经下场了。

根据北达科他州官员的披露,除了微软、OpenAI和xAI,还有两家AI巨头也正在酝酿建造「巨型AI数据中心」。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

这两家公司找到了商务专员Josh Teigen和州长Doug Burgum,商讨建立巨型AI数据中心。

除了技术研发,这类数据中心也对资源和基础设施提出了很高的要求。

不仅需要采购足够的芯片和相关设备,还要留出数万英亩的土地、建设新的发电设施。

马斯克的Colossus要自建发电站才能弄出200兆瓦,而这两家公司可能是因为直接找上了州长,他们的初始电力就能达到500~1000兆瓦,并计划在几年内扩增至5k~1w兆瓦。

这些项目的规模将比现有的任何数据中心,包括Colossus都扩大几个数量级。

100兆瓦可以为7万至10万个家庭供电;去年微软Azure的全球数据中心总共使用了大约5吉瓦(5k兆瓦)的电力。

这就意味着,一个数据中心,可能和整个Azure云服务平台的耗电量相当。

根据会议的音频记录,这类规模的项目耗资可能超过1250亿美元。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

在对外会议上,商务专员Teigen没有透露这两家神秘AI巨头的名字,但他表示市值达到了「一万亿美元」。

这就将潜在名单缩小到了美国的大约6家公司,七巨头之六——英伟达、亚马逊、微软、谷歌、Meta和苹果。

微软此前就和OpenAI讨论过建造价值1000亿美元的「星际之门」(Stargate),而且北达科他州长Doug Burgum曾是微软的高管,在2001年以11亿美元向微软出售过自己的一家软件公司。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

但我们也知道,谷歌和亚马逊等其他公司也在积极提升其AI计算能力。

揭开美国AI超算的神秘面纱

AI巨头一向对尖端技术严格保密,但他们对开发数据中心所需的技术,保密程度有过之而无不及。

The Information列出了在美国7个州运营或计划中的17个超算数据中心,涉及微软、OpenAI、Meta和xAI等公司。

总的来说,仍在开发或计划阶段的设施建设成本可能超过500亿美元,其中包括约350亿美元的英伟达芯片,以及运营所需的额外数十亿美元。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

这些超算估计在数年时间内落成,并需要大量的芯片、土地和电力。

在ChatGPT问世前,GPU集群通常只包含几千个芯片。如今,一些最大的GPU集群拥有超过3万个芯片,上面提到的这些超算更是达到了前所未有的规模。

要为所有计划中的数据中心供电,美国能源部预计会出现电力不足的情况,因此最近提出了一些解决方案,例如资助研究使AI计算更高效。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

争夺「下一个高地」

现在,数据中心竞赛的焦点,集中到了英伟达CEO黄仁勋的身上。

就在上周,老黄发表了以下言论,宛如在业内投入一颗炸弹。

率先达到超算集群下一个高地的人,将实现革命性的AI水平。

此言一出,英伟达的GPU,谁敢不买?

即使已经和博通共同设计出了TPU的谷歌,最近也为英伟达即将推出的Blackwell下了大单。

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

对GPU的争夺,已经引发了AI开发者及其云供应商之间的紧张局势,甚至,有时还会引发它们和英伟达的摩擦。

比如,马斯克就曾考虑和甲骨文达成一项大规模协议,根据他的计划,xAI将在未来几年内,花费超过100亿美元租赁英伟达的GPU。

而这项谈判最终破裂了,部分原因在于,马斯克认为甲骨文无法足够快地建起超算,而甲骨文则担心,他会把GPU集群放在一个供电不足的地方。

芯片多多,问题多多

很多超大的GPU集群都位于土地辽阔、空间充裕且电力充足的地区。例如,马斯克的Colossus特意选址在田纳西州孟菲斯,亚马逊、Meta和微软都在亚利桑那州的凤凰城地区运营AI服务器。

但随着更大的GPU集群需要更多的电力,AI巨头们正计划在非传统数据中心枢纽的地区建造这些集群。

例如,亚马逊最近在宾夕法尼亚州中部的一座核电站旁边购置了土地,计划供应约一吉瓦(1000兆瓦)的电力。

这足以为整个旧金山供电,或者构建多达100万张GPU的集群。

另一个挑战是如何进行设备冷却。

传统上,数据中心一般采用风冷,但GPU服务器产生的热量远远超过传统服务器。

为了更佳的冷却效果,微软在威斯康星州为OpenAI建设的数据中心预计将使用液冷而非风冷。

毕竟,竞家都All In了,你能不上吗?

六巨头割据,群雄逐鹿,谁将夺得下一个超算高地?

内容链接:https://www.hpaper.cn/20669.html

(0)
上一篇 2024-09-05 下午2:53
下一篇 2024-09-05 下午3:00

相关推荐

  • 华为三折叠,炸出570万「黄牛」

    「核心提示」人人争当黄牛背后,是三折叠手机备受追捧。沉积的手机市场,太需要这样的“王炸”来唤醒了。 作者 | 陈法善 编辑 | 刘杨 备货量100万台,发布四天就有近570万人预约,华为三折叠手机Mate XT注定是今年最难抢的手机。 要知道,根据IDC的统计,2023年中国折叠屏手机总出货量约700.7万台。也就是说,华为这一个单品,就…

    1天前
    1.1K
  • 比亚迪员工总数突破 90 万,技术研发人员近 11 万全球车企第一

    IT之家 9 月 13 日消息,比亚迪集团品牌及公关处总经理李云飞今日在微博上透露,今天,比亚迪员工总数突破 90 万,是 5300 多家 A 股上市公司里员工人数最多的,比第二名还要多 40 多万人。 李云飞还表示:“比亚迪 90 万员工中,技术研发人员近 11 万,是全球研发人员最多的车企。过去两年还招聘了近 5 万名优秀应届大学生,持续助力大学生就业。…

    2天前
    501
  • 从Vertu到8848,奢侈品手机为何全军覆没

    华为三折叠终于发布了,19999元起售。 主要噱头是比折叠还多一折,但也引起了互联网的广泛争论。 在争论之中,黄牛早已率先抢购。 据网上消息,黄牛把三折叠已经炒到了一台65万。 一台38万,有人为了提升销量,黄牛给出的利好是全国可飞。 大家都知道这个溢价不可持续。可大家的疑惑点在于,华为三折叠的受众是谁? 为何有种魔幻的吸引力? 如果堆科技参数。 我可以告诉…

    3天前
    754
  • 苹果谷歌的合作关系正在升级?苹果新推视觉搜索功能

    财联社9月11日讯(编辑 周子意)苹果在9月9日的发布会上推出了视觉搜索功能——“视觉智能(Visual Intelligence)”,这一功能提供了一种与软件和服务交互的新范式,也为其搜索引入了新的模式。 苹果将“视觉智能”描述为一种即时了解你所看到的一切的方式。发布会上,苹果解释称,“视觉智能”功能可以被用来做更多的事情,它不仅仅是一种帮助用户了解相机视…

    4天前
    2.4K
  • 外媒评苹果新品发布会:AI或助苹果在中国保持竞争力

    9月10日消息,美国时间周一,苹果在2024秋季新品发布会上推出了最新款iPhone、Watch和AirPods等硬件产品。iPhone 16系列毫无疑问再次成为焦点。苹果押注,人工智能支持的iPhone将有助于提振销量,保持在中国市场的竞争力。以下是主流媒体对苹果发布会的点评: 路透社:AI助力苹果在中国市场保持竞争力 苹果最新发布的iPhone 16系列…

    5天前
    2.2K
  • 华为Mate XT震撼发布:余承东宣布全球首款三折叠手机引领行业新潮流

    9月10日,华为在“见非凡品牌盛典及鸿蒙智行新品发布会”上正式推出了其备受瞩目的全球首款三折叠手机——华为Mate XT。华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东在发布会上发表演讲,详细介绍了这款集前沿科技与创新设计于一体的旗舰产品,并展望了其对行业未来的深远影响。 余承东激动地表示:“华为团队历经五年奋斗,终于将科幻变成现实,今天发布…

    5天前
    490
  • 苹果与华为发布会“正面交锋”:iPhone 16 AI功能在中国大陆受限,华为Mate XT引领三折叠手机新风潮

    2024年9月10日,全球科技界迎来了一场前所未有的盛宴。苹果与华为两大科技巨头在这一天几乎同时举行了年度新品发布会,吸引了全球消费者的目光。然而,在这场科技盛宴中,iPhone 16系列与华为Mate XT三折叠手机的发布,不仅展示了各自品牌的最新技术创新,也揭示了科技行业竞争的新格局。 iPhone 16 AI功能在中国大陆受限 当地时间9月9日上午(北…

    6天前
    175
  • 华为Mate XT 非凡大师发布在即,三折叠设计或引领柔性屏产业新风向

    随着华为Mate XT 非凡大师发布日期的临近——定于9月10日下午14:30,市场对该款手机的关注度持续攀升,预约情况呈现出火爆态势。这一创新的三折叠手机设计,不仅预示着智能手机形态的新变革,还可能对柔性屏产业及相关企业,如京东方、TCL等,产生深远的潜在影响。 据观察,华为Mate XT 非凡大师自曝光以来,便吸引了大量消费者的目光。在华为官方商城及各大…

    6天前
    494
  • 苹果华为新机同日上市,靠谱剧透都在这里了

    iPhone 16发布在即,各种剧透释出,苹果发力AI的意味更浓厚了。 最瞩目的便是在芯片上,库克一改此前精准刀法,直接给iPhone 16全系用上全新A18芯片,大家都有8GB内存。 这不就是为了Apple Intelligence而来? 发布会海报更是Siri味道十足。 明天凌晨1点,苹果“It’s Glowtime”发布会带着iPhone 16全系、最…

    6天前
    4.0K
  • 中国车企避免掉入“利润下滑”舆论陷阱

    (文/张家栋 编辑/高莘) 近期,海外评级机构穆迪副总裁兼高级信贷官Gerwin Ho表示,“尽管需求强劲,但激烈的国内竞争正在侵蚀中国电动汽车制造商的盈利能力。” 该机构还在一份中国电动汽车行业报告中指出,中国车企之所以大力推动海外市场建设,是因为国内盈利前景黯淡。 在全球化的背景下,影响力日益强大的中国汽车品牌走出国门,面向全球市场已经成为必然趋势,但在…

    2024-09-06
    584
  • 两家AI巨头正讨论建超级AI数据中心 每个耗资1250亿美元

    9月4日消息,全球顶尖的人工智能开发商对其最先进的技术一向保密,而对于开发这些技术所需的专业数据中心,他们则更加讳莫如深。 据美国科技媒体《The Information》披露,美国七个州有17个已建成或规划中的人工智能数据中心,这些数据中心有时被称为超级计算机或人工智能芯片集群。目前,这些超级计算数据中心或已投入运营,或正由微软、OpenAI、Meta及埃…

    2024-09-04
    2.8K
  • 特斯拉中国回应明年生产六座版 Model Y:不实消息

    IT之家 9 月 3 日消息,路透社今日报道称,特斯拉计划于 2025 年底开始在国内生产六座版 Model Y。特斯拉中国向界面新闻回应表示:“不实消息”。 有知情人士对路透社表示,特斯拉已要求供应商为其上海工厂 Model Y 产量实现两位数增长做好相应准备。 参考IT之家此前报道称,特斯拉于 2020 年发布了 Model Y,并一直在开发一项名为“J…

    2024-09-03
    5.3K
  • 零跑首次交付超3万辆,蔚来销量连续4个月超2万辆,8月新势力“成绩单”出炉

    9月1日,多家新能源车企公布了8月的交付数据。从已公布的数据来看,多家企业实现了销量或交付量的同比增长,延续了“淡季不淡”的销售趋势。 造车新势力方面,理想汽车依旧位列当月新车交付榜第一位。理想汽车公布的8月交付数据显示,其交付新车4.81万辆,同比增长37.8%;2024年1月~8月,理想汽车共交付28.81万辆汽车。截至2024年8月31日,理想汽车已累…

    2024-09-02
    600
  • BBA车主的面子,被假货三件套背刺

    有网友吐槽BBA的赠品:以前买奔驰全是原厂的。后来买奥迪一半是原厂的,现在买宝马全是淘宝货。 作者|钱多多 编辑|原 野 曾经,有人买BBA就是买个标。 现在,印着BBA车标的赠品正在痛击BBA车主的面子。 有BBA车主发现,自己在购车时与销售多轮拉扯要来的赠品小熊,疑似为网购的20元假货。廉价假货重灾区集中在小熊、雨伞、行李箱,并称:假货三件套。相比蔚来、…

    2024-08-30
    5.0K
  • 李想解读理想汽车财报:鸿蒙智行是强劲对手,我们持续学习华为

    雷递网 乐天 8月28日 理想汽车(Nasdaq: LI; HKEX: 2015)今日公布2024年第二季度财报。理想汽车董事长兼CEO李想、总裁、总工程师马东辉、CFO李铁、销售与服务高级副总裁邹良军出席电话会议。 李想在电话会议上表示,鸿蒙智行是理想汽车在市场上最强劲的对手,双方会长期健康地共存下去。从另一个角度看,理想汽车的核心态度是要长期地、持续地向…

    2024-08-29
    2.2K
  • 是谁接住了《黑神话:悟空》撒出的“泼天富贵”?

    《黑神话:悟空》正在改写中国游戏的历史,同时扮演着极具“钞能力”的带货王。 据游戏科学官方消息,发售3天之后,截至2024年8月23日21点整,中国首款3A大作《黑神话:悟空》全平台销量已超过1000万套,全平台最高同时在线人数达300万人。 这一数据不仅大幅打破国产游戏的销售纪录,也使《黑神话:悟空》成为有史以来销量达到1000万最快的主机游戏之一。即使是…

    2024-08-28
    1.1K
  • 第十三届中国创新创业大赛(海南赛区)暨海南省第十届“科创杯”创新创业大赛决赛在海口圆满落幕

    8月27日,第十三届中国创新创业大赛(海南赛区)暨海南省第十届“科创杯”创新创业大赛决赛在海口圆满落幕。在颁奖典礼活动环节,海南省政府张华伟副秘书长出席活动并为初创组一等奖和成长组一等奖的获奖企业颁奖,海南省科技厅党组书记李劲松在活动现场致辞并宣读大赛获奖决定,并同时授予2家一等奖的获奖企业省重点研发项目的立项支持,海南省科技厅副厅长蒙巍向13位决赛评委颁发…

    2024-08-28
    695
  • 枢密院十号:放着现成的“龙”飞船不坐,NASA为何非要两名美国宇航员再“漂”半年?

    美国国家航空航天局纠结了许久之后,终于还是给波音公司沉重一击:两名在国际空间站滞留的美国宇航员将由美国太空探索技术公司(SpaceX)的载人“龙”飞船在明年2月送回地球,而波音公司出现故障的“星际客机”飞船则将在今年9月以无人驾驶模式自行返航。 应该说,对于这个结局,其实外界早有预感,毕竟NASA给了波音公司足够长的时间,但依然没有能够彻底解决“星际客机”飞…

    2024-08-27
    1.0K
  • 波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”

    8月24日下午,2024世界机器人大会上,举行了一场期待已久的中国、美国“具身智能”与人形机器人领域学者的“世界对谈”。 大名鼎鼎的“机器狗之父”、美国波士顿动力创始人Marc Raibert(马克·雷伯特)首次来到北京。他说,“我简直不敢相信,不仅是机器人的数量,难以置信,还有这么多热情的人参加了展览。中国对机器人的兴奋和热情很高。” 而此次与Marc对谈…

    2024-08-26
    3.7K
  • 《黑神话:悟空》销量超1000万套,游戏科学CEO:很快,很意外

    8月23日,《黑神话:悟空》官方账号发文称,截止北京时间2024年8月23日21点整,全平台销量已超过1000万套,全平台最高同时在线人数300万人。 游戏开发公司游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥也在微博发文称,“很快,很意外,很high,也很respect~”冯骥写道,这座山,靠我,靠几个老哥,也许能爬300米,但绝对、绝对爬不到现在的高…

    2024-08-24
    6.7K