4月11日上午,北京國家會議中心,阿里云峰會。阿里巴巴自研GPT大模型終于揭下神秘面紗。
這也是繼百度“文心一言”之后,第二個由科技巨頭主導并對外發布的國產大模型。雖然目前360等企業同樣推出了類ChatGPT產品,但百度與阿里作為消費互聯網和云計算領域的龍頭企業,無疑被視為大模型之戰中,現階段實力最為強勁的玩家。
(資料圖片僅供參考)
在公開亮相之前,阿里方面對“通義千問”的相關信息保持著低調。
此前,阿里云公眾號曾在4月7日發布邀測文章,但很快又進行了刪除,拿到邀請碼的用戶并不多。
隨后在4月8日舉行的一場AI大模型行業論壇上,阿里云達摩院語言技術實驗室負責人黃非原定作為倒數第二位嘉賓上場,分享《通義大模型體系及應用》。不過,最后黃非并未如期出席。
可以說,關于通義千問最重要的信息,都被留在了這場令人矚目的峰會上。
阿里如何盤算通義千問?
通義千問發布之后,阿里云下一步的動作是什么?未來要怎么做大模型?與其他大模型相比,通義千問有哪些特色?這無疑是本屆云峰會上最大的看點。
在峰會上,阿里云CEO張勇和CTO周靖人揭示了這三個問題的答案。
張勇提到,在未來阿里云將推出一系列AI大模型及圍繞模型的服務。在這個產品體系中,通義千問僅是其中一種產品選擇。
實際上,早在2022年9月舉辦的世界人工智能大會上,阿里云就發布了“通義”大模型系列。通義千問是這一系列中的“新成員”。
張勇還宣布,阿里所有產品未來將接入大模型,進行智能化升級,包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等。不過,會后周靖人在采訪環節表示,阿里全線產品接入大模型還沒有具體的時間表。
同時,阿里云還將積極推動企業客戶接入大模型,他提到:“今天,阿里云將把這些AI基礎設施和大模型能力向所有企業開放,共同推動AI產業的發展。”
目前,阿里云已經與多家企業展開了合作探索,包括OPPO安第斯智能云、太平洋保險、吉利汽車、上汽、奇瑞汽車、毫末智行、太古可口可樂、波司登、掌閱科技等等。
▲(大模型將接入阿里所有產品,圖源/市界攝于阿里云峰會)
周靖人展示,通義千問具有多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等能力。不過據「市界」對通義千問的試用,當前版本的模型還不具備文字之外的多模態內容生成、理解能力。
對此周靖人說道:“目前我們開放了通義千問作為語言模型的原始能力,今后我們還會逐漸將搜索、知識增強等能力接入到通義千問的產品體系中,不斷對產品體系進行升級。此外為了更好地使用千問,我們還需要不單單以web的形式與千問進行交流、提問,為了便于開發者去實現一系列應用,我們還將提供多種模型的接入、調用方式,用簡單的API的方式去實現這樣的能力。”
換句話說,通義千問未來將像ChatGPT、GPT-4一樣,提供插件功能,允許開發者進行個性化開發、形成產品生態。
▲(當前版本的通義千問還不具備圖片生成能力,圖源/通義千問)
此外,周靖人還介紹了阿里云在訓練、部署大模型背后的技術支撐,并從模型訓練、模型推理、模型服務的成本三方面分別進行闡述。
據其分享,針對模型訓練任務,阿里云啟動了靈駿計算集群進行算力、存儲支撐,靈駿平臺能夠支撐10萬張GPU卡的計算規模,并實現低延遲互聯。
推理方面,阿里云可以把模型部署在全球28個地域。同時,為了降低模型服務成本,阿里云可通過對模型的壓縮,將成本降低至1/8。
張勇在阿里云的第一戰
在通義千問發布之后,阿里云還將有一系列新動作,包括在4月18日發布行業大模型,以及尚未公布舉辦時間的生態大會——峰會上,張勇透露阿里云會在生態大會上提出全新生態戰略。
接下來緊鑼密鼓的新產品和戰略發布,也意味著張勇和阿里云緊繃的“弦”,還不能松懈下來。
這個4月對于阿里巴巴來說頗不平靜:創始人馬云回國引發大量關注,一號位張勇官宣組織大變陣造成的熱議仍在坊間流傳……每個人都在關心,這家龐大的商業體下一步將要做些什么、去往何方。通義千問正是在這樣的背景中亮相。
“張勇看起來又老了。”在云峰會會場中,一位熟悉阿里云的人士對「市界」說道。
在會上張勇也坦言:“(這個4月)對我來說也是一個全新開始,大家都知道,年初我躬身入局,親自帶隊阿里云業務。”
從各個角度而言,大模型通義千問都在阿里云內部獲得了極高的優先級。
據一位阿里員工告訴「市界」:“這段時間雖然阿里云研發人員很少直接見到老逍,但后者一直在親自盯云業務線,主要對接云業務的高層(注:張勇花名為逍遙子)。”
無論是從技術迭代浪潮的沖刷,還是從阿里自身來考慮,入局NLP大模型都是阿里云不得不打的一場仗。
▲(圖源/市界攝于阿里云峰會)
一方面,OpenAI發布的ChatGPT為整個行業做了議程設置。為了追趕大洋彼岸的強勁對手、不錯過對NLP階段性關鍵產品的攻城略地,包括阿里云在內的科技巨頭們只能奮起直追。
特別是對阿里云來說,其在發布國產NLP大模型方面的時間表,已經比百度晚了一步。
在大模型的搶灘期,越早發布產品,意味著能夠越早與企業伙伴達成合作。3月16日,百度舉辦大模型發布會時,官方數據稱已有650家企業宣布接入文心一言。在拓展模型生態方面,阿里云或已落在后頭。
另一方面,對于阿里云和整個阿里集團而言,面對消費互聯網發展空間越發狹窄、產業互聯網增長遭遇瓶頸的現實,找到新的增長引擎更是十分緊迫。
2022年12月29日,張勇發出全員郵件,將新一年的關鍵字定為“進”,而上一年的關鍵字是“定”。同樣是在這封郵件中,張勇宣布自己將直接兼任阿里云總裁的職位。
從“定”到“進”的轉變過程中,大模型成為這家云計算巨頭不能錯過的風口。
面對友商在大模型市場中的競爭和開拓大模型市場的挑戰,阿里云在峰會上提到將全力投入AI建設。不過,周靖人表示,全力投入并不是不計成本all in AI ,“阿里云在智能方面的投入沒有改變,我們一直是云智一體,不是all in,而是一如既往地投入……我們一直在做深度研發,策略沒有改變”。
此前,周靖人也曾在接受品玩采訪時提到:“通義千問是我們的一個中間態……它不是起點也不是終點,是個既定路線上的節點。我們這次是把過去積累的一部分工作向社會,向開發者開放。”
作為對比,百度在3月16日發布文心一言時,稱文心一言對標的是2022年11月的ChatGPT版本。而阿里云并未公布通義千問對標的行業產品。
為了不斷逼近“既定路線”上的目標,阿里云還需要不斷推進“中間態”模型的迭代,以及拓展模型應用生態。
大模型賽道卷起來了
從2022年末至今,由ChatGPT掀起的大模型爭霸賽愈演愈熱,下場選手已經越來越多。
就在阿里云峰會舉辦前兩天的4月9日,360宣布基于360GPT大模型開發的人工智能產品矩陣“360智腦”率先落地搜索場景,將面向企業用戶開放內測。
緊隨其后,“港股AI第一股”商湯科技在4月10日發布了名為“日日新SenseNova”的大模型體系。該體系下的千億級語言大模型“商量SenseChat”號稱擁有多輪對話和超長文本理解能力。
接下來,知乎、科大訊飛等企業將發布AI技術進展或相關戰略。美團聯合創始人王慧文創辦的光年之外、搜狗創始人王小川創辦的百川智能……許多創企同樣瞄準了這條賽道。
另外,盡管華為、京東、騰訊等大廠尚未對外公開發布大模型產品,這些企業均有相應的技術布局。
AI從業者蒙靈告訴「市界」:“我們業內的人都在調侃,NLP大模型的市場還沒來得及‘變藍(海)’,可能就要‘紅(海)’了。”
扎堆涌入的大小市場參與者,都在押寶一種名為MaaS(模型即服務)的商業模式。也就是如同SaaS、PaaS等云計算商業模式一樣,允許客戶利用大模型底座打造出個性化功能。李彥宏曾對此預測:“之前企業選擇云廠商更多看算力、存儲等基礎云服務。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用這四層之間的協同。”
▲(圖源/市界攝于阿里云峰會)
但同時,市場普遍認為大模型市場將迎來激烈的競合,最終僅留下少量玩家。如OpenAI(ChatGPT的發布方)創始人Sam Altman曾經的預測:“將來應該會出現幾個大型的基礎模型,開發人員都將基于這些基礎模型研發AI應用。”
華為云人工智能領域首席科學家田奇也曾提出,未來“大模型將成為應對AI領域應用碎片化的一種方式,相較于此前不同場景對應不同小模型的狀況,未來大模型有可能收編高度定制化的小模型,導致市場向大公司集中”。
另外,還有聲音認為大模型并非解決所有商業問題的最佳解。
一家AI創企業務負責人告訴「市界」:“在很多的應用場景中,并不需要用大模型來解決問題,用一個小模型、中模型就能把問題解決得很好,所以說殺雞焉用牛刀?況且中小企業客戶的付費能力無法支撐接入大廠大模型。那未來應該怎么辦?是像當初云計算市場一樣,先用ToC打法去燒錢搶市場還是有新的玩法,我們都不知道。”
無論如何,一場全球科技企業都積極參與的AI爭霸賽已然開始。
在阿里云峰會上,張勇說道:“所有行業和服務都值得重新做一遍。”但在重新定義千行百業的商業模式之前,還有許多問題需要解決。通義千問、文心一言或許都僅是一個開始。
作者 | 董溫淑
編輯 | 董雨晴