華為推出全新架構(gòu)昇騰 AI 計(jì)算集群,支持超萬(wàn)億參數(shù)大模型訓(xùn)練

2023-09-21 09:23:48   評(píng)論:0   [收藏]   [評(píng)論]
導(dǎo)讀:  9 月 20 日消息,在今日舉行的華為全聯(lián)接大會(huì) 2023 期間,華為常務(wù)董事、ICT 基礎(chǔ)設(shè)施業(yè)務(wù)管理委員會(huì)主任、企業(yè) BG 總裁汪濤正式發(fā)布全新架構(gòu)的昇騰 AI 計(jì)算集群 ——Atlas 900 SuperCluster,
  9 月 20 日消息,在今日舉行的華為全聯(lián)接大會(huì) 2023 期間,華為常務(wù)董事、ICT 基礎(chǔ)設(shè)施業(yè)務(wù)管理委員會(huì)主任、企業(yè) BG 總裁汪濤正式發(fā)布全新架構(gòu)的昇騰 AI 計(jì)算集群 ——Atlas 900 SuperCluster,可支持超萬(wàn)億參數(shù)的大模型訓(xùn)練。

  據(jù)介紹,新集群采用了全新的華為星河 AI 智算交換機(jī) CloudEngine XH16800,借助其高密的 800GE 端口能力,兩層交換網(wǎng)絡(luò)即可實(shí)現(xiàn) 2250 節(jié)點(diǎn)(等效于 18000 張卡)超大規(guī)模無(wú)收斂集群組網(wǎng)。

  新集群同時(shí)使用了創(chuàng)新的超節(jié)點(diǎn)架構(gòu),大大提升了大模型訓(xùn)練能力。此外,發(fā)揮華為在計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、能源等領(lǐng)域的綜合優(yōu)勢(shì),從器件級(jí)、節(jié)點(diǎn)級(jí)、集群級(jí)和業(yè)務(wù)級(jí)全面提升系統(tǒng)可靠性,將大模型訓(xùn)練穩(wěn)定性從天級(jí)提升到月級(jí)。

  此外,華為發(fā)布了更開(kāi)放、更易用的 CANN 7.0 異構(gòu)計(jì)算架構(gòu),不僅全面兼容業(yè)界的 AI 框架、加速庫(kù)和主流大模型,還深度開(kāi)放底層能力,讓 AI 框架和加速庫(kù)可以更直接地調(diào)用和管理計(jì)算資源,使能開(kāi)發(fā)者自定義高性能算子,讓大模型具備差異化的競(jìng)爭(zhēng)力。

  華為還升級(jí)了 Ascend C 編程語(yǔ)言,以更高效的編程方式,簡(jiǎn)化算子實(shí)現(xiàn)邏輯,大幅縮短融合算子的開(kāi)發(fā)周期,為 AI 模型與應(yīng)用的快速開(kāi)發(fā)賦能。

  面向全球企業(yè)和開(kāi)發(fā)者,華為云官網(wǎng)今日正式上線昇騰 AI 云服務(wù)“百模千態(tài)”專區(qū),專區(qū)收錄了業(yè)界主流開(kāi)源大模型,并全面基于昇騰 AI 云服務(wù)進(jìn)行適配和優(yōu)化;提供應(yīng)用開(kāi)發(fā)的工具鏈,開(kāi)發(fā)工具已經(jīng)全部實(shí)現(xiàn)了云化,免去繁瑣的配置流程,實(shí)現(xiàn)一鍵接入,即開(kāi)即用。

  IT之家查詢獲悉,截至今年 7 月,昇騰 AI 集群已支撐全國(guó) 25 個(gè)城市的人工智能計(jì)算中心建設(shè),其中 7 個(gè)城市公共算力平臺(tái)入選首批國(guó)家“新一代人工智能公共算力開(kāi)放創(chuàng)新平臺(tái)”。

  同時(shí),昇騰 AI 已發(fā)展 30 多家硬件伙伴、1200 多家 ISV,聯(lián)合推出了 2500 多個(gè)行業(yè) AI 解決方案,規(guī)模服務(wù)于運(yùn)營(yíng)商、互聯(lián)網(wǎng)、金融等行業(yè)。

分享到:
責(zé)任編輯:zsz

網(wǎng)友評(píng)論