焦點(diǎn)精選!深耕大模型,一個(gè)AI先行者的9年實(shí)踐

2023-03-29 18:58:48 來(lái)源:市界觀察

打印 放大 縮小

上市一年有余,“AI第一股”商湯科技再次交出了一份穩(wěn)健的業(yè)績(jī)答卷。數(shù)據(jù)顯示商湯科技2022年?duì)I收達(dá)38.09億元,毛利率為66.8%。

2021年12月30日,商湯科技成功登陸港股,造就了全球AI(人工智能)領(lǐng)域最大資金規(guī)模的IPO。


【資料圖】

彼時(shí),產(chǎn)業(yè)已經(jīng)渡過(guò)早期的喧囂,開始邁進(jìn)發(fā)展的深水區(qū),質(zhì)疑伴隨著市場(chǎng)的理性情緒一起到來(lái)。這樣的背景中,堅(jiān)持對(duì)AI基礎(chǔ)設(shè)施SenseCore進(jìn)行研發(fā)投入的商湯科技走上了一條孤獨(dú)之路。

彼時(shí)沒人能想到,一年之后,NLP大模型ChatGPT在全球掀起熱潮,吸引無(wú)數(shù)企業(yè)和資本爭(zhēng)相涌入這一領(lǐng)域。

對(duì)于商湯科技而言,從2014年成立開始,對(duì)大模型及相關(guān)技術(shù)的積累就貫穿于企業(yè)的生命線之中。發(fā)展至今,公司已經(jīng)摸索出屬于自己的獨(dú)特發(fā)展路徑。

作為長(zhǎng)期深耕底層技術(shù)研發(fā)、不斷探索和更新商業(yè)化路徑的“領(lǐng)先選手”,一幅值得期待的藍(lán)圖正在商湯科技面前慢慢展開。

大模型熱潮中的穩(wěn)健標(biāo)的

早在1965年,人工智能先驅(qū)、圖靈的老師司馬賀曾樂觀預(yù)測(cè)道:“在20年之內(nèi),機(jī)器就能夠做到一個(gè)人能做到的任何事。”

遺憾的是,技術(shù)的發(fā)展與迭代難以預(yù)測(cè)。隨著產(chǎn)業(yè)發(fā)展,研究者們將這種理想的模型概念進(jìn)一步擴(kuò)充為“通用人工智能(Artificial General Intelligence,AGI)”——具有一般人類智慧,可以執(zhí)行人類能夠執(zhí)行的任何智力任務(wù)的機(jī)器智能。但盡管一代代研發(fā)者進(jìn)行投入,通用人工智能的實(shí)現(xiàn)仍舊遙遠(yuǎn)。

直到2022年末,NLP(自然語(yǔ)言處理)大模型ChatGPT橫空出世,這個(gè)上知天文、下知地理的生成式AI模型讓人們意識(shí)到,或許人類終于敲開了通用人工智能的大門。這也是比爾·蓋茨評(píng)價(jià)ChatGPT誕生“意義不亞于互聯(lián)網(wǎng)和個(gè)人電腦的誕生”的原因。

技術(shù)跨越式演進(jìn)掀起的熱潮,終于讓資本意識(shí)到了超大模型的研發(fā)價(jià)值。

仿佛一夕之間,對(duì)人工智能的投資再次成為主流話題,不僅一級(jí)市場(chǎng)中“生成式AI項(xiàng)目”成為追逐熱點(diǎn),國(guó)際科技大廠紛紛入局;二級(jí)市場(chǎng)中,相關(guān)概念股的股價(jià)隨之水漲船高。

然而,突擊式的投資、對(duì)熱點(diǎn)和市場(chǎng)情緒的追逐,從來(lái)都不是人工智能產(chǎn)業(yè)發(fā)展的“脈搏”所在。就像商湯科技董事長(zhǎng)、首席執(zhí)行官徐立在2022世界人工智能大會(huì)上曾說(shuō)過(guò)的:“人工智能和天文都是寂寞的科學(xué),需要大量且漫長(zhǎng)的長(zhǎng)期積累。”

隨著產(chǎn)業(yè)發(fā)展趨向于理性,狂熱的情緒終會(huì)消弭,企業(yè)實(shí)力才是玩家們最終能否趕上這一波大模型風(fēng)口的關(guān)鍵點(diǎn)。

對(duì)AI企業(yè)而言,保持技術(shù)和產(chǎn)品的先進(jìn)程度、積極探求商業(yè)化的可能性尤為重要。

從這兩個(gè)角度而言,商湯科技均已走在了行業(yè)的前頭。

基于此前積累的技術(shù)能力,2023年3月14日,商湯科技開源了多模態(tài)(指能夠處理文本、圖像、音視頻等多種數(shù)據(jù)類型)多任務(wù)通用大模型“書生(INTERN)2.5”。

書生2.5在多模態(tài)多任務(wù)處理能力方面實(shí)現(xiàn)多項(xiàng)全新突破,具備圖文跨模態(tài)開放任務(wù)處理能力,可為自動(dòng)駕駛、機(jī)器人等通用場(chǎng)景任務(wù)提供高效精準(zhǔn)的感知和理解能力支持。

這也是在ChatGPT掀起大模型熱潮之后,國(guó)內(nèi)較早發(fā)布的自研大語(yǔ)言模型。從發(fā)布當(dāng)日起,書生2.5就在通用視覺開源平臺(tái)OpenGVLab上開源。

▲(書生2.5,圖源/商湯科技)

在保持技術(shù)領(lǐng)先的同時(shí),商湯科技還在持續(xù)優(yōu)化自己的盈利能力。

根據(jù)最新發(fā)布的2022年業(yè)績(jī)報(bào)告,商湯科技業(yè)務(wù)結(jié)構(gòu)實(shí)現(xiàn)轉(zhuǎn)型,智慧生活、智能汽車、智慧商業(yè)、智慧城市四大業(yè)務(wù)線矩陣全面升級(jí),其中智慧生活、智能汽車整體收入均大幅上漲。

“大模型+大裝置”長(zhǎng)期戰(zhàn)略彰顯前瞻性

早在2015年,商湯科技就開始研發(fā)深度學(xué)習(xí)訓(xùn)練框架SenseParrots,并逐漸以此為核心、持續(xù)研發(fā)攻堅(jiān),搭建起AI基礎(chǔ)設(shè)施SenseCore,賦能千行百業(yè)。

至今,商湯科技仍保持著穩(wěn)定、高水平的研發(fā)投入。以2022年為例,商湯科技研發(fā)投入達(dá)到40.14億元。同時(shí)在2022年,商湯科技的人均研發(fā)效率持續(xù)提升,人均每年研發(fā)模型數(shù)相較于2021年進(jìn)一步提高了90%,達(dá)到9.35個(gè)。

這種對(duì)SenseCore AI大裝置的長(zhǎng)期投入,成為了商湯科技能夠在大模型潮流中保持領(lǐng)先的“底氣”。

SenseCore建立在AI原生基礎(chǔ)設(shè)施層、深度學(xué)習(xí)平臺(tái)層、算法模型層之上,打通了算力、平臺(tái)、算法。基于此,商湯科技能夠?qū)⒉煌瑢哟蔚哪芰Π葱枵{(diào)配,進(jìn)行流暢、標(biāo)準(zhǔn)化、端到端的AI模型自動(dòng)生產(chǎn)過(guò)程,也就是提供AIaaS(人工智能即服務(wù))。

▲(商湯科技SenseCore AI大裝置,圖源/商湯科技)

SenseCore AI大裝置的特點(diǎn),可以被歸結(jié)為普惠、彈性、開放這三個(gè)詞語(yǔ)。其所提供的AIaaS具體包括IaaS(計(jì)算基礎(chǔ)設(shè)施服務(wù))、PaaS(深度學(xué)習(xí)平臺(tái)服務(wù))、MaaS(模型部署及推理服務(wù))三大部分的能力。

不論是大模型客戶,還是垂直領(lǐng)域內(nèi)的中小模型客戶,不論是需要成熟模型遷移的用戶,還是AI模型研發(fā)者,都可以借助SenseCore“搭配”出適合自己的解決方案。

在此前的實(shí)踐中,商湯科技已經(jīng)賦能了許多行業(yè)的2B客戶,截至2022年末,商湯科技累計(jì)生產(chǎn)的商用AI模型達(dá)到了6.7萬(wàn)個(gè)。

在大模型領(lǐng)域,SenseCore AI大裝置同樣經(jīng)受得起考驗(yàn)。2022年,商湯科技全面布局生成類預(yù)訓(xùn)練大模型,實(shí)現(xiàn)并完善了文本、語(yǔ)音、圖像、視頻、3D場(chǎng)景的多模態(tài)生成能力。

年內(nèi),商湯科技SenseCore AI大裝置持續(xù)擴(kuò)建,完成了2.7萬(wàn)塊GPU的部署并實(shí)現(xiàn)了5.0 exaFLOPS(每秒浮點(diǎn)運(yùn)算次數(shù),一種計(jì)算速度單位)的算力輸出能力。在這一基礎(chǔ)上,SenseCore AI大裝置最多可以支持20個(gè)千億參數(shù)量大模型(以千卡并行)同時(shí)訓(xùn)練,最高可支持萬(wàn)億參數(shù)超大模型的訓(xùn)練。

在通過(guò)各類資源的精準(zhǔn)組合來(lái)保證大模型訓(xùn)練效果這一方面,商湯科技已經(jīng)用實(shí)踐證明了自己的實(shí)力。

以商湯科技在2023年初開源的多模態(tài)多任務(wù)通用大模型“書生(INTERN)2.5”為例,書生2.5擁有30億參數(shù),是目前全球開源模型中ImageNet準(zhǔn)確度最高、規(guī)模最大,同時(shí)也是物體檢測(cè)標(biāo)桿數(shù)據(jù)集COCO中唯一超過(guò)65.0 mAP(全類平均正確率)的模型。

至今,SenseCore已支持了超過(guò)10個(gè)大模型訓(xùn)練項(xiàng)目,其中包括語(yǔ)言大模型、文生圖模型、視覺大模型、多模態(tài)模型等商湯自研模型和客戶自定義模型。

在服務(wù)8家客戶進(jìn)行大模型訓(xùn)練的過(guò)程中,商湯SenseCore AI大裝置總共提供了7000多張GPU。

追尋技術(shù)最高目標(biāo)的“長(zhǎng)跑”

如果說(shuō)近期各類大模型的興起,敲開了通用人工智能的大門,那么,什么時(shí)候才能實(shí)現(xiàn)真正的通用人工智能?

對(duì)這個(gè)問(wèn)題,還沒有人能給出答案。就像OpenAI(ChatGPT大語(yǔ)言模型的研發(fā)機(jī)構(gòu))創(chuàng)始人Sam Altman說(shuō)的那樣:“我對(duì)此只有一個(gè)新的認(rèn)識(shí),那就是它不會(huì)是一蹴而就,而將是一個(gè)漸進(jìn)的過(guò)程。也就是“緩慢起飛”。人們對(duì)什么時(shí)候能實(shí)現(xiàn)AGI,不會(huì)達(dá)成共識(shí)。”

不過(guò),可以確定的是,我們正處在不斷逼近技術(shù)終極目標(biāo)的長(zhǎng)征路上。每一項(xiàng)人工智能的技術(shù)創(chuàng)新,都有望成為哺育新興業(yè)態(tài)、促進(jìn)既有商業(yè)模式煥新、解放生產(chǎn)力的一片肥沃土壤。

據(jù)Gartner預(yù)測(cè),至2023年將有20%的內(nèi)容被生成式AI所創(chuàng)建;至2025年生成式AI產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%(目前不到1%)。另?yè)?jù)紅杉預(yù)測(cè)生成式AI將產(chǎn)生數(shù)萬(wàn)億美元經(jīng)濟(jì)價(jià)值,到2025年,國(guó)內(nèi)生成式AI應(yīng)用規(guī)模有望突破2000億。

而在這條通往通用人工智能的路上,唯一的“鑰匙”就是堅(jiān)持研發(fā)和投入,秉持不斷試錯(cuò)和調(diào)整步伐的耐心與決心。

從2014年成立開始,商湯科技已然踏足這條對(duì)技術(shù)終極目標(biāo)的追逐之路,成為整個(gè)產(chǎn)業(yè)中的標(biāo)桿玩家。未來(lái),商湯科技仍將繼續(xù)這場(chǎng)“長(zhǎng)跑”。

商湯科技表示,未來(lái)公司將繼續(xù)把實(shí)現(xiàn)通用人工智能作為核心發(fā)展戰(zhàn)略,并從5大方面進(jìn)行深入挖掘和探索。

具體來(lái)說(shuō),公司將以SenseCore AI大裝置作為大模型生產(chǎn)的核心平臺(tái),持續(xù)擴(kuò)展大裝置的能力,包括投資高性能計(jì)算基礎(chǔ)設(shè)施例如高速網(wǎng)絡(luò)、大規(guī)模數(shù)據(jù)存儲(chǔ)以及強(qiáng)大的計(jì)算節(jié)點(diǎn)。

商湯科技還計(jì)劃將多模態(tài)大模型的研發(fā)作為戰(zhàn)略投入方向,不斷提升大模型的數(shù)據(jù)理解和生成能力、多任務(wù)泛化能力。

另外,商湯將與全球領(lǐng)先的芯片制造商、全球研究機(jī)構(gòu)、高校和企業(yè)展開合作,共同探索算力優(yōu)化的新途徑,推動(dòng)AI算力的發(fā)展。

為了確保AI技術(shù)的發(fā)展惠及全人類,致力于降低AI技術(shù)的成本和門檻,商湯科技將通過(guò)開源項(xiàng)目、共享資源和合作研究等方式,與全球AI研究者和開發(fā)者共同推進(jìn)AI技術(shù)的發(fā)展。

在商業(yè)化角度,商湯科技將推進(jìn)大裝置和大模型能力對(duì)智慧生活、智能汽車、智慧商業(yè)、智慧城市四大板塊賦能。通過(guò)充分利用大模型的能力,不斷升級(jí)、強(qiáng)化四大業(yè)務(wù)線產(chǎn)品矩陣,提高產(chǎn)品競(jìng)爭(zhēng)力,以商業(yè)化為抓手提升人工智能在各行各業(yè)的應(yīng)用。

市場(chǎng)熱情如潮水般時(shí)漲時(shí)落,而對(duì)硬科技企業(yè)而言,追逐熱點(diǎn)勢(shì)必難以攀上技術(shù)的高峰。想要達(dá)到技術(shù)的下一階段,堅(jiān)持長(zhǎng)期主義才是唯一的方法論。

就像商湯科技董事長(zhǎng)、首席執(zhí)行官徐立在接受采訪時(shí)曾提到的:“商湯科技優(yōu)勢(shì)在于長(zhǎng)線的人工智能發(fā)展思維及商業(yè)落地的能力。我始終認(rèn)為,技術(shù)運(yùn)用到行業(yè)中是有工業(yè)使用的紅線。如果技術(shù)沒有達(dá)到紅線,就很難發(fā)揮商業(yè)價(jià)值。”

在真正到達(dá)通用人工智能的“彼岸”之前,AI產(chǎn)業(yè)中還需要更多如商湯科技一般的玩家,對(duì)長(zhǎng)期主義施以實(shí)踐。

參考文獻(xiàn):

《人工智能推動(dòng)世界前行》,新華訪談

作者 | 董溫淑

編輯 | 董雨晴

關(guān)鍵詞:

責(zé)任編輯:ERM523

相關(guān)閱讀

主站蜘蛛池模板: 日本高清com| 精品久久8X国产免费观看| 欧美A级毛欧美1级a大片免费播放| 免费观看成人毛片| 裴远之的原型人物是谁| 国产日韩精品一区二区三区| 91久久国产精品| 女人张腿让男桶免费视频大全| 亚洲成人免费在线观看| 穿透明白衬衫喷奶水在线播放| 国产一卡二卡≡卡四卡免费乱码 | 十七岁免费完整版bd| 西西人体高清444rt·wang| 国产手机在线αⅴ片无码观看| 50岁老女人的毛片免费观看| 大又大粗又爽又黄少妇毛片| 一本大道在线无码一区| 插插插综合视频| 久久午夜夜伦鲁鲁片无码免费| 树林里狠狠地撞击着h| 亚洲大尺度无码无码专区| 激情偷乱在线观看视频播放| 免费一级毛片在线播放傲雪网| 国产色丁香久久综合| 国产精品盗摄一区二区在线| JZZIJZZIJ日本成熟少妇| 小宝极品内射国产在线| 中文字幕乱码人妻综合二区三区| 日本精品啪啪一区二区三区| 久久躁狠狠躁夜夜AV| 欧洲精品久久久AV无码电影| 亚洲国产美女视频| 欧美综合自拍亚洲综合图| 亚洲老熟女@TubeumTV| 男生和女生一起差差在线观看| 加勒比色综合久久久久久久久| 老师白妇少洁王局长| 国产一区亚洲欧美成人| 视频一区二区在线观看| 国产伦精品一区二区三区| 韩国免费观看高清完整|