找回密码
 立即注册
搜索
日产 讴歌 福特 极氪 林肯 阿尔法 保时捷 奔腾 长城 东风 哈弗 Jeep 捷途 岚图 理想 兰博基尼 名爵 马自达 玛莎拉蒂 欧拉 奇瑞 smart 沙龙 坦克 特斯拉 蔚来 沃尔沃 小鹏 雪佛兰 高合 奥迪 丰田 本田 雷克萨斯 英菲尼迪 捷达 捷豹路虎 阿斯顿 马丁 罗密欧 标致 宾利 长安 法拉利 红旗 几何 凯迪拉克 领克 劳斯莱斯 路特斯 MINI 迈凯伦 哪吒 起亚 荣威 三菱 斯巴鲁 腾势 魏牌 五菱 现代 雪铁龙 宝骏 大众 宝马 比亚迪

AI算力集群迈进“万卡”时代 超节点为什么火了?

[XinWen.Mobi 原创复制链接分享]
xinwen.mobi 发表于 2025-7-31 03:25:15 | 显示全部楼层 |阅读模式
随着AI算力集群迈入“万卡”时代,超节点因其能满足大模型对算力的严苛要求、突破传统算力架构局限等优势而备受关注,成为行业热点。具体原因如下:应对大模型算力需求:大模型参数量迈向万亿,对算力要求极高,需要大量算力芯片协同工作。超节点可将几十张GPU整合在一个节点内,且内部有冗余和容错能力,还具备强大的调度能力,能将模型训练分布到每个GPU上做并行计算,有效支撑千亿乃至万亿参数模型的训练和推理。突破传统架构局限:传统算力架构难以满足高效、低耗、大规模协同的AI训练需求。超节点作为Scale Up(纵向扩展)的当前最优解,通过内部高速总线互连,能加速GPU之间的参数交换和数据同步,缩短大模型的训练周期。提升算力利用效率:超节点通过整合算力芯片资源,在节点内构建低延迟、高带宽的算力实体,让单个超节点尽可能大地释放算力,避免芯片空闲,提高了算力利用效率。解决制程提升难题:随着摩尔定律面临“失灵”风险,提升单颗芯片计算性能难度增大。超节点技术成为提升芯片制程之外,另一条能提高芯片集群性能的路径。国内厂商可通过超节点方案部署更大规模的芯片集群来弥补单点性能的不足,以量补质,继续提升集群性能。优化散热与供电:传统风冷AI服务器功率密度逼近极限,标准机柜塞满高功耗GPU服务器后,散热和供电挑战巨大。超节点通过液冷等先进散热技术,将数十甚至上百个计算单元整合在一个高度集成的机柜或机组中,极大地提升了算力密度和能源效率(PUE)。推动产业协同发展:超节点的发展可推动相关产业协同发展,形成“技术-产品-服务”的闭环生态。例如光跃LightSphere X方案,可推动上海本地光芯片、液冷技术、GPU模组等产业发展,同时光交换芯片的低功耗特性及液冷技术的应用,还助力数据中心绿色转型,符合国家“双碳”目标。
回复

使用道具 举报

QQ|标签|爬虫xml|爬虫txt|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-11-2 04:34 , Processed in 0.082548 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

消息来源网络

快速回复 返回顶部 返回列表