由ChatGPT掀起的大模型熱潮仍在席卷,科技巨頭們正摩拳擦掌爭先涌入這條賽道,沒有人甘愿放棄這場角逐賽。
繼3月份百度推出“文心一言”、4月初阿里云達摩院開啟“通義千問”外部測試之后,華為云也要下場了。
(資料圖)
華為云官網顯示,其自研的大模型“盤古”即將對外上線,但并未顯示具體的上線時間。
4月8日上午,華為云人工智能領域首席科學家田奇現身《人工智能大模型技術高峰論壇》,分享了華為云盤古大模型的進展及其應用。
據悉,田奇是美國伊利諾伊大學香檳分校博士、IEEE Fellow(美國電子電氣工程師學會會士),也是原德州大學圣安東尼奧分校計算機系正教授。2020年3月起,田奇加入華為云,參與了盤古大模型立項至今的研發進程。
最強大的國產ChatGPT?
事實上,盤古大模型在兩年前就曾公開亮相,但未曾開放外部使用。
早在2021年4月,剛剛接任華為云CEO的余承東在HDC華為開發者大會上宣布“華為云盤古系列AI大數據模型”正式發布。彼時余承東自信表示:“這是今天最重磅的產品。”
根據公開信息,華為云從2020年9月就開始推動盤古大模型項目的立項,并在2020年11月內部立項成功。
最初發布時,該系列模型中共包括四個子模型,分別為:NLP(自然語言處理)大模型、CV(計算機視覺)大模型、多模態大模型、科學計算大模型。
其中NLP正是ChatGPT、文心一言、通義千問等近期走紅的大模型所屬的技術領域。盤古NLP大模型是由華為云、循環智能和鵬城實驗室聯合開發,被稱為是業界首個千億參數的中文預訓練大模型。
在2021年4月正式亮相后,盤古系列大模型仍在持續更新。根據田奇分享,2021年9月,華為云發布了盤古藥物分析大模型;2022年6月,華為云發布了盤古礦山大模型;2022年11月,盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型同期亮相。
▲(華為云盤古大模型發展歷程,圖源/人工智能大模型技術高峰論壇)
在4月8日上午的演講中,田奇主要提及了盤古CV大模型、科學計算大模型等的具體應用,對盤古NLP大模型僅以寥寥數語帶過:“NLP大模型來講的話,我們去年交付了一個阿拉伯語的千億級大模型,也在一些榜單上取得了比較好的成績,同時去年在備案檢索方面、在中國智能技術評測中也取得了第一的成績。”
盡管仍稍顯神秘,華為云的大模型已吸引了眾多眼球。西南證券研報寫到:“盤古大模型將是超過任何其他類似應用的最先進、最強大的自然語言處理應用。”
民生證券研報同樣曾指出:“(華為云盤古大模型)是目前最接近人類理解水平的預訓練模型。將通用知識與行業經驗相結合,在生成與理解性能上處于領先地位。”
華為盤古,劍指AI碎片化場景應用
在分享中,田奇將華為云盤古大模型在過去一年的實踐總結為:“在2022年的話,主要是做好行業應用AI和Industry(工業),希望在煤礦、水泥、電力、金融、農業創造更多的產業價值來幫助客戶。”
未來,華為云盤古NLP大模型或將在智能文檔搜索、智能ERP(企業資源計劃)、小語種大模型等行業或領域率先落地。田奇稱:“業界預計人工智能的行業滲透率持續攀升,到2026年將達到20%。而隨著近期的AI大模型的爆發,接下來滲透率提升可能進一步提速。”
▲(圖源/人工智能大模型技術高峰論壇)
整體而言,華為云盤古大模型強調泛化能力、重點發展方向在于細分場景的落地應用、賦能千行百業。與之對比,較早發布的百度文心一言更加強調在與用戶對話互動、協助創作、信息整合等方面的應用。
行業觀察者張雪峰告訴「市界」:“不同企業的大模型在應用場景、數據來源、算法模型等方面有所不同。這些模型的異同也反映了不同企業在技術積累和市場布局方面的差異。”
接下來,隨著商湯科技、科大訊飛等科技企業陸續推出相應產品,大模型賽道將進一步擁擠起來。
然而,盡管許多玩家同臺競技、試圖奪下一張參與全球技術浪潮迭代的“早鳥票”,市場普遍認為未來大模型市場勢必將迎來新一輪的整合與洗牌。
如OpenAI(ChatGPT的發布方)創始人Sam Altman曾經預測:“將來應該會出現幾個大型的基礎模型,開發人員都將基于這些基礎模型研發AI應用。”
田奇也在分享中提到,未來“大模型將成為應對AI領域應用碎片化的一種方式,相較于此前不同場景對應不同小模型的狀況,未來大模型有可能收編高度定制化的小模型,導致市場向大公司集中”。
這場人工智能應用角逐賽才剛剛開始。
作者 | 董溫淑
編輯 | 董雨晴