近日,以“AI引領時代,算力驅動未來”為主題的“臨港新片區智算大會”舉行。會上,新片區智算產業聯盟正式成立,商湯科技作為算力提供企業成為聯盟一員,同時商湯科技被授予“新片區智算產業鏈鏈主”企業。
作為臨港算力生態的積極參與者,商湯目前已建設了亞洲目前最大的智能計算平臺之一——商湯AIDC,可以輸出5000 Petaflops的總算力,可支持20個千億參數量的超大模型同時訓練。以AIDC為底座、前瞻打造的商湯大裝置SenseCore,致力于打造高效率、低成本、規模化的下一代AI 基礎設施與服務,賦能人工智能生產新范式,將成為AGI時代的基礎設施服務領導者。
AI大模型浪潮下,算力需求爆增
人工智能三大要素主要包括數據、算法以及算力。根據OpenAI近日發布的數據,自2012年以來人工智能訓練任務中使用的算力呈指數級增長,其增長速度為每3.5個月翻一倍。截止目前人們對算力的需求已增長了超過30萬倍,ChatGPT的火爆引發了市場對算力方面的新需求。
目前我國算力市場保持持續增長,經信通院測算,2021年我國計算設備算力總規模達到202 EFlops,增速約50%,高于全球增速。
在此背景下,上海臨港積極發揮本地算力產業優勢和生態牽引作用,發布了《臨港新片區加快構建算力產業生態行動方案》(以下簡稱《方案》)。
據介紹,臨港新片區算力產業已在上游軟硬件、中游的數據中心、調度平臺、下游應用都進行了相應布局,目前臨港總算力超過3EFLOPS(FP32),智能算力占比近80%,總算力規模約占上海市近20%。
《方案》提出,目標到2025年,臨港新片區將形成以智算算力為主、基礎算力和超算算力協同的多元算力供給體系,總算力超過5EFLOPS(FP32),AI算力占比達到80%,算力產業總體規模突破100億元,建成公共算力服務平臺,規范算力交易機制,實現區域算力調度,打造具有全國影響力的算力產業集聚區,建設一批算力示范應用標桿場景。
商湯科技董事長兼CEO徐立表示,算力是新時代的能源,某種程度上,算力決定了市場的競爭力。“算力是整個模型能力的表達,等于算法或者說大模型的參數去乘上它所處理的數據量。大模型時代參數越大,乘上的數據量越大,所需要的算力就越大。”
與此同時,臨港新片區智算產業聯盟正式成立,該產業聯盟成員代表由25家企業和3所高校與科研院所共同組成,后續將開展資源共享、技術交流和項目合作,推動新片區智算產業應用賦能經濟發展。
商湯科技被授予“新片區智算產業鏈鏈主”,位于臨港新片區的商湯科技智能計算中心承載著長三角開展大規模人工智能研發和產業化重任,后續將積極參與到臨港智算產業鏈的協同融合和集聚發展。
大模型+大算力融合創新
大模型和大算力的融合正在掀起生產范式的重大轉變,推動科學研究和產業應用邁向智能計算驅動的通用人工智能(AGI)時代。在技術快速迭代的發展初期階段,行業亟需構建新一代的基礎設施,降低應用門檻、縮短研發周期、提高創新效率。
商湯科技超前布局,歷時五年,打造了商湯大裝置SenseCore,并在此基礎上構建了“商湯日日新SenseNova”大模型體系,為行業提供覆蓋大模型算法服務、訓練和推理優化以及數據服務等軟硬結合的AGI基礎設施。
據介紹,商湯大裝置SenseCore以商湯人工智能計算中心(簡稱“商湯智算中心或商湯AIDC”)為算力基座,包含27,000塊GPU,可以輸出5000 Petaflops的總算力,擁有行業領先的算力輸出能力、超大模型訓練及大規模推理能力,是亞洲目前最大的智能計算平臺之一。
商湯大裝置SenseCore當前算力可支持20個千億參數量的超大模型同時訓練,并提供涵蓋數據、訓練工具、推理部署、性能優化一條龍的大模型基礎設施服務體系。
商湯大裝置擁有出色的并行計算能力,能夠以最大3200卡規模集群進行單任務訓練,并可做到七天以上不間斷的穩定訓練,不僅支持了商湯自身的大模型訓練項目,而且還訓練了其他企業自定義的模型。
此外,商湯大裝置融合了AI、超算與大數據的核心能力,通過為AI優化的高性能計算、高性能存儲及緩存、高性能網絡,以存算分離,大規模彈性、容錯調度等特征,支撐大模型在數千張卡、PB級存儲上,完成萬億級參數大模型訓練。
SenseCore AI平臺產品還提供了模塊化、全鏈條的數據、訓練及推理能力。可實現百億級數據管理及檢索,人工標注服務,加速AI大模型研發效率。一鍵量化、一鍵部署、一鍵應用,提供了大模型快速上線驗證的工具,加速創新。
此外,大裝置還為客戶及生態伙伴提供全鏈條MaaS大模型即服務,加速大模型的創新和應用效率。
其中,自動化數據標注服務可將智能標注效率提升百倍;大模型推理部署服務可將大模型推理效率提高600%;大模型并行訓練服務支持單集群3200卡5000億稠密參數模型訓練;大模型增量訓練服務能夠將增量微調成本降低90%。
商湯AI大模型賦能多產業發展
在大裝置的賦能下,商湯在大模型領域實現了飛速發展。
據徐立介紹,今年3月開源的“書生2.5”多模態大模型在檢測、分割、分類三大主流視覺任務下二十多個權威數據集上全面領先,這為自動駕駛、機器人等通用場景任務提供高效精準的感知和理解能力支持。
對于人工智能基礎科學(AI For Science)而言,在氣象氣候預報任務中,全球中期天氣預報是最重要的預測任務之一。今年4月亮相的全球中期氣象預報AI大模型“風烏”首次實現在高分辨率上對核心大氣變量進行超過10天的有效預報,且在80%的評估指標上超越GraphCast模型。得益于對高分辨率全球大氣數據建模,“風烏”還可以模擬臺風等極端氣象,準確預測臺風軌跡。
商湯構建的業界首個感知決策一體化的端到端自動駕駛解決方案UniAD,在多項關鍵數據集與指標上超越了SOTA方法,使車道線的預測準確率提升了30%,預測運動位移的誤差降低了近40%,規劃誤差降低了近30%。
此外,商湯還在上月推出的SenseEarth 3.0遙感大模型不僅擁有業內最全的解譯類別,且在解譯效率、泛化能力、解譯精度等眾多指標上均實現了技術突破。
徐立表示,“在AGI時代,模型的能力可以用算力來衡量。我們以商湯大裝置SenseCore打造AGI時代的基礎設施,在模型的迭代速度及處理問題的能力上日日更新,不斷解鎖AGI的更多可能。”
據悉,截至今年5月,商湯大裝置已累計服務超40個核心客戶,其中大模型客戶10家以上,涵蓋智能駕駛、生物制藥、芯片設計、智慧商業、高校科研等前沿領域,并已在超過20個落地場景中實現大模型交付。
商湯科技聯合創始人、大裝置事業群總裁楊帆表示,如今所看到的大模型的成績發展,是通過人工智能三要素的持續規模上升帶來的技術價值的提升,同時也是這種基礎的研發能力和系統的工程化能力深度的完美結合。這三要素很多時候是聯合調優的,算法的優化、數據的整理和選取以及算力的平臺性,這三者間往往是互相連通的,很難把它們變成割裂的環節獨自去做。這就是為什么要做智能算力產業鏈,因為只有鏈上的更多企業,促進彼此的交流合作思考,更深度的進行合作,才能夠在新的關鍵性的重大技術浪潮中,做到更好的技術進步和支持。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。