美国科技巨头微软已将其位于威斯康星州和亚特兰大的两大数据中心互联◈✿,构建起一座“AI超级工厂”◈✿,可大规模加速新AI模型的训练进程◈✿。这家总部位于雷德蒙德的公司在周三宣布◈✿,正打造一类名为“Fairwater数据中心”的特殊设施◈✿,这些数据中心采用统一的架构与设计◈✿,旨在作为协同整体运行◈✿。
Fairwater数据中心通过互联确保彼此间数据流无缝高速传输◈✿。这一设施使得分布在不同地理区域的Fairwater站点能够在数周而非数月内完成AI模型训练◈✿。微软的Fairwater数据中心网络专为支持OpenAI及微软人工智能超级智能团队使用先进GPU执行运算任务而设计◈✿。
微软Azure基础设施总经理阿利斯泰尔·斯皮尔斯表示◈✿:“我们构建的是一个分布式网络◈✿,它能作为虚拟超级计算机◈✿,以单一设施无法实现的方式应对全球性重大挑战122cc太阳集团◈✿。”
随着AI模型规模日益庞大◈✿,每一代新模型都需要更多参数(即使AI能理解处理信息并输出准确答案的内部设置)◈✿。当参数达到万亿级时122cc太阳集团◈✿,模型需学习参考的数据量也急剧增长◈✿。最终波肖门尾图◈✿,训练这些模型需要更强大的算力◈✿,未来单数据中心可能难以胜任◈✿。
微软的Fairwater数据中心通过构建统一分布式系统解决这一难题122cc太阳集团122cc太阳集团◈✿。每个站点不再处理零散任务波肖门尾图◈✿,而是协同完成同一项巨型训练任务的一部分◈✿。这种分工协作使训练拥有数百亿参数的模型成为可能 —— 这是传统数据中心无法实现的壮举◈✿。
斯皮尔斯进一步阐释了数据中心网络与单一设施的区别◈✿:“传统数据中心旨在为多客户运行数百万独立应用◈✿,而我们将此称为AI超级工厂◈✿,是因为它在数百万硬件设备上协同处理单一复杂任务◈✿。这不仅是单个站点训练AI模型◈✿,更是整个网络共同支撑同一项工作◈✿。”
Fairwater AI数据中心采用NVIDIA GB200 NVL72机架级系统波肖门尾图◈✿,可扩展至数十万个NVIDIA Blackwell GPU◈✿。它们部署了新型芯片与机架架构◈✿,提供当今所有云平台中每机架最高吞吐量122cc太阳集团◈✿。数据中心采用双层设计以实现更高GPU密度◈✿,并配备先进液冷设施◈✿,运行时耗水量极低波肖门尾图◈✿。
微软强调其重点在于构建稳健的系统与基础设施◈✿,而非单纯增加GPU数量波肖门尾图122cc太阳集团◈✿。微软云与人工智能执行副总裁斯科特·格思里指出◈✿:“领跑AI领域不仅需要增加GPU◈✿,更需要构建让它们协同工作的基础设施◈✿。”
随着更多AI数据中心纳入规划◈✿,微软将通过专用光缆连接成AI广域网(AI WAN)◈✿。该系统将使数据以光速传输◈✿,规避任何潜在拥堵◈✿。
微软在340亿美元资本支出中为数据中心与GPU投入巨资◈✿,以满足日益增长的AI算力需求◈✿。竞争对手如亚马逊也在印第安纳州重资投入“Project Rainer”综合体◈✿,采取类似策略◈✿。Meta波肖门尾图◈✿、谷歌◈✿、OpenAI和Anthropic同样共同投入数百亿美元建设新站点◈✿、芯片与系统◈✿。
尽管部分分析师认为存在AI泡沫迹象◈✿,但微软与其他科技巨头坚持认为需求真实存在◈✿,并已通过超出供应能力的长期客户合同得到验证◈✿。suncity太阳集团◈✿,太阳成集团◈✿,大阳城集团网站◈✿。122cc太阳集团◈✿,suncitygroup太阳官方网站太阳集团suncity太阳新城◈✿!
English
中文简体
