圖說:位于臨港新片區(qū)的商湯人工智能計算中心 采訪對象供圖
每秒百億、千億次的浮點(diǎn)運(yùn)算能力,千萬億字節(jié)(PB)級的數(shù)據(jù)存儲規(guī)模……許多人可能對這些指標(biāo)沒有太多概念;但要說起對答如流的大語言模型,自動駕駛中反應(yīng)神速的汽車,大家應(yīng)該不會感到陌生了吧。
看得見的應(yīng)用背后,是看不見的算力在支撐。“大模型時代”誰能占得先機(jī),這個問題誰說了“算”?在2023世界人工智能大會召開之際,記者探訪了商湯科技人工智能計算中心(AIDC)。
(資料圖片僅供參考)
如今,基于最新人工智能理論、采用領(lǐng)先人工智能計算架構(gòu),提供算力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)的智算中心,在推進(jìn)大模型能力和數(shù)字經(jīng)濟(jì)發(fā)展中正發(fā)揮著越來越重要的作用。
新民晚報記者 陳炅瑋 攝(下同)
算力:AIGC時代不可或缺的“血液”
這座位于臨港新片區(qū)的商湯人工智能計算中心,是目前全亞洲規(guī)模最大的人工智能計算中心之一。經(jīng)過一年半的運(yùn)營,今天的算力規(guī)模已經(jīng)達(dá)到了5000PFLPOS(1PFLPOS相當(dāng)于每秒可以進(jìn)行1千萬億次浮點(diǎn)運(yùn)算)的體量,超過了當(dāng)時設(shè)計的算力規(guī)模水平。
“換句話說,商湯智算中心的峰值算力可以達(dá)到每秒500億億次浮點(diǎn)運(yùn)算。通過這樣的一個超大規(guī)模的算力,我們可以支持20個千億參數(shù)超大模型同時進(jìn)行訓(xùn)練,并提供完整的人工智能基礎(chǔ)設(shè)施資源的能力。”商湯AI大裝置產(chǎn)業(yè)賦能中心主任蔣欽告訴記者。
大模型吹響了生成式人工智能(AIGC)的號角,這必然伴隨著能源的進(jìn)一步開發(fā)。這樣的“能源”,在AIGC時代,正是無數(shù)服務(wù)器中運(yùn)轉(zhuǎn)不息的龐大算力。打比方說,大模型若是人工智能抽象化的“身體”,那么海量的算力,則是維系身體運(yùn)轉(zhuǎn)的“血液”。
蔣欽解釋,所謂算力并不是單一概念,它包括通用算力,就是以CPU芯片為主的算力;還包括超算,就是各種超算中心提供的高性能算力,主要服務(wù)于科學(xué)計算;還有目前非常熱門的智能算力,即以GPU為典型代表的,以AI芯片為主的服務(wù)于人工智能訓(xùn)練和推理相關(guān)需求的計算能力。
其中,以AI芯片為主的人工智能算力近年來呈現(xiàn)快速增長態(tài)勢。中國信通院統(tǒng)計顯示,2016年的算力結(jié)構(gòu)中,國內(nèi)人工智能算力比例只占3%左右;而截至去年,整個人工智能算力比重已超過半壁江山。
大模型時代到來 算力夠用嗎?
隨著人工智能技術(shù)的高速發(fā)展,以及大語言模型的出現(xiàn)和應(yīng)用,各行各業(yè)對智能算力的需求也在與日俱增。
按照摩爾定律,算力基本每兩年就要翻一番,但這般迅猛的增長速度也無法滿足人類對算力的需求。蔣欽介紹,2012年前后是一道分水嶺,隨著深度學(xué)習(xí)的興起,在此之后,最先進(jìn)人工智能模型的計算量每三四個月就翻一番,也就是每年增長近10倍,比摩爾定律2年增長一倍快得多。尤其是最近幾年,在大模型取得突破、應(yīng)用場景的廣泛開拓與深入發(fā)展的背景下,對智能算力的需求迎來井噴。
沒有人會否認(rèn),大模型江湖的混戰(zhàn)已然愈演愈烈,“下場”的選手越來越多。由大模型為代表引發(fā)的的人工智能新技術(shù)熱潮,會帶動整個算力需求呈現(xiàn)出非常旺盛的態(tài)勢。
“大模型需要處理海量的數(shù)據(jù),并且需要在短時間內(nèi)完成復(fù)雜的計算任務(wù),這就意味著需要更高的計算能力。”蔣欽指出,“大模型也需要訪問大量的數(shù)據(jù),存儲大量的參數(shù)和中間結(jié)果,因此需要更大的內(nèi)存容量。”與此同時,大模型需要在多個硬件設(shè)備上同時進(jìn)行計算,因此需要更好的并行計算能力;而在“雙碳”背景下,消耗大量的能源的大模型也在呼喚更高能效比的算力。
“雖然純CPU算力也能用來進(jìn)行部分人工智能計算,但效率非常低、能耗非常高。我們不會以這樣的算力形式去支撐產(chǎn)業(yè)的發(fā)展。”蔣欽判斷,“而搭載以AI芯片為主的新型算力基礎(chǔ)設(shè)施是未來發(fā)展的重要趨勢和熱潮。”
他告訴記者,在大模型的熱潮下,算力服務(wù)器目前呈現(xiàn)緊缺狀態(tài),“大模型的發(fā)展和智能算力底座有著深刻聯(lián)系,需要在大規(guī)模資源匯聚的基礎(chǔ)上做好算力、算法、數(shù)據(jù)三要素的協(xié)同實(shí)踐和聯(lián)合優(yōu)化,助力實(shí)體經(jīng)濟(jì)高質(zhì)量發(fā)展。”
助力臨港打造智能算力新高地
作為亞洲已投入使用的、最大規(guī)模的單節(jié)點(diǎn)智能計算中心,商湯AIDC除了算力規(guī)模體量巨大外,與之相配套的人工智能模型開發(fā)工具,針對大模型的訓(xùn)練、推理、數(shù)據(jù)優(yōu)化服務(wù)等,都可以高效率、低成本、規(guī)模化地支撐和服務(wù)好目前以大模型為代表的整個人工智能產(chǎn)業(yè)的高速發(fā)展。
今年上半年,人工智能應(yīng)用向縱深發(fā)展:AIGC打造的“數(shù)字人”效果媲美真人水平;人工智能預(yù)測蛋白質(zhì)結(jié)構(gòu)給基礎(chǔ)研究帶來全新的研究手段;人工智能驅(qū)動的大語言模型在多輪次對話和長文本理解能力上突飛猛進(jìn)……這些無不依賴算力提供支撐。
“商湯人工智能計算中心除了為‘日日新’大模型體系提供底層算力基座和AI工具的支撐外,也為其他行業(yè)賦能AI相關(guān)的基礎(chǔ)能力。”蔣欽介紹,“通過云服務(wù)的方式,我們已在泛互聯(lián)網(wǎng)、泛娛樂、自動駕駛、科研院所等多個領(lǐng)域里支持了十余家大模型客戶的開發(fā)工作。”
記者了解到,商湯人工智能計算中心之后會依托臨港,進(jìn)一步夯實(shí)算力底座,擴(kuò)大算力規(guī)模。在算力軟件平臺相關(guān)技術(shù)領(lǐng)域,持續(xù)對集群架構(gòu)、集群網(wǎng)絡(luò)、存儲性能、能源管理等多方面開展技術(shù)攻關(guān),對于大模型訓(xùn)練與推理定向支持等開展技術(shù)迭代更新,以支撐更大規(guī)模的算力集群落地,助力臨港打造智能算力新高地。
“臨港本身具有非常強(qiáng)大的區(qū)域產(chǎn)業(yè)優(yōu)勢,集聚了集成電路、人工智能、生物醫(yī)藥、高端裝備制造、新能源汽車等核心優(yōu)勢產(chǎn)業(yè)。這也要求我們圍繞這些優(yōu)勢產(chǎn)業(yè)去打造人工智能基礎(chǔ)設(shè)施行業(yè)解決方案與豐富的產(chǎn)業(yè)上下游生態(tài),做好產(chǎn)業(yè)智能化升級的算力底座。”蔣欽表示。
新民晚報記者 郜陽
【延伸閱讀】2023年是屬于“大模型”的一年 “百模大戰(zhàn)”搶灘智慧未來