(資料圖)
快科技8月11日消息,近日,小米的大語言模型MiLM-6B首次現(xiàn)身C-Eval、CMMLU兩大AI模型評測榜單。
截至本文成稿,MiLM-6B在C-Eval總榜單排名第10、同參數(shù)量級排名第1,在CMMLU中文向大模型排名第1。
根據(jù)C-Eval給出的信息,MiLM-6B模型在各個測試科目中的平均成績?nèi)缦拢?/p>
具體各科目成績上,在STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué)教育)全部20個科目中,計量師、物理、化學(xué)、生物等多個項目獲得了較高的準(zhǔn)確率。
而在10個社會科學(xué)科目中,該模型在教育學(xué)和地理外的所有科目,都獲得了較為理想的準(zhǔn)確率。
人文科學(xué)的11個科目中,MiLM-6B則在歷史與法律基礎(chǔ)上有著不錯的準(zhǔn)確率表現(xiàn)。
可以看出,MiLM-6B模型目前已經(jīng)在大多數(shù)科目中表現(xiàn)出了相對良好的準(zhǔn)確度,但在諸如法學(xué)、數(shù)學(xué)、編程、概率論、離散數(shù)學(xué)等科目上的表現(xiàn)依舊有明顯進步空間。
快科技延展閱讀:
根據(jù)GitHub項目頁給出的信息,MiLM-6B是由小米開發(fā)的一個大規(guī)模預(yù)訓(xùn)練語言模型,參數(shù)規(guī)模為64億。