五大模型解高考數學:阿里通義千問、360智腦10題全錯得0分;訊飛星火答對一半_環球看點

2023-06-09 00:15:14 來源:搜狐科技

打印 放大 縮小

一年一度高考季,高考試題是大眾關注的焦點,也成為了AI能力的試金石。AI大模型數學功底到底如何?比人類“聰明”嗎?搜狐科技使用五款AI大模型對2023高考上海數學試卷進行了同題測試。


(資料圖片)

在測試中,搜狐科技選取了高考試卷前10道填空題,讓百度文心一言、阿里通義千問、科大訊飛星火認知大模型、360智腦、ChatGPT進行回答。

測試結果顯示,這五款大模型在答數學題的能力上差異顯著。

最“聰明”的訊飛星火答對了5題,正確率50%。百度文心一言和ChatGPT“緊跟其后”,答對了4題,正確率為40%。

360智腦和通義千問則“全軍覆沒”,一道題也沒答對,交了白卷。

值得一提的是,昨天搜狐科技也用五款大語言模型產品,對高考作文全國卷(甲)進行了測試,并邀請了5位語文名師打分。

打分結果顯示,ChatGPT高考作文得分最高,文心一言、訊飛星火得分稍低,但跟ChatGPT處于同一水平。360智腦和通義千問得分最低。

雖然語文作文題和數學計算題,對大模型能力考察的維度并不盡相同。但巧合的是,不擅長寫作文的360智腦和通義千問,似乎也不擅長做數學題。

通過這兩次高考題測試,也能從側面反應出各家大模型的能力確實是“參差不齊”。如果ChatGPT、文心一言、訊飛星火是“學霸”,那么360智腦和通義千問則是妥妥的“學渣”。

附測試中使用的高考數學題題目:

1.不等式|x-2|<1的解集為__

2.a=(2,3),b=(-1,2),則a·b=__

3.首項為3,公比為2的等比數列的前六項和S6=__

4.tanA=3,tan2A=__

5.f(x)={2^xx>0;1,x≤0}的值域為__

6.復數z=1-i,則|1+iz|=__

7.圓的方程x^2+y^2-4y-m=0的面積為π,則m=__

8.三角形的三邊長為a=4,b=5,c=6,則sinA=__

9.某地一年四個季度的GDP(億元),第一季度GDP為232,第四季度GDP為241,且四個季度的GDP逐季度增長,中位數、平均數相等。則該地一年的GDP為__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0,正數k的最大值為__

責任編輯:

關鍵詞:

責任編輯:ERM523

相關閱讀

主站蜘蛛池模板: 噼里啪啦免费观看高清动漫| 亚洲一级毛片免观看| a级成人毛片完整版| 欧美一区二区三区四区视频| 国产三级小视频在线观看| avtt加勒比手机版天堂网| 最新中文字幕在线播放| 午夜成人无码福利免费视频| 18禁男女爽爽爽午夜网站免费| 女网址www女大全小| 么公的又大又深又硬又爽视频 | 人妻大战黑人白浆狂泄| 久草视频免费在线观看| 婷婷丁香五月中文字幕| 亚洲av色无码乱码在线观看| 精品人妻AV区波多野结衣| 国产乱理伦片a级在线观看| 99re热在线观看| 好痛太长太深弄死我了视频| 久久精品韩国三级| 激情综合网五月| 国产乱子伦精品无码码专区| 色噜噜狠狠一区二区| 国产精品素人福利| 中文japanese在线播放| 日本老师和同学xxxx| 亚洲精品无码久久久| 粉色视频免费入口| 国产国产在线播放你懂的| 99久久免费观看| 我就想添50多的老女人水很多| 久久精品亚洲一区二区三区浴池| 深夜福利视频网站| 免费啪啪小视频| 精品日韩一区二区三区视频| 国产成人免费a在线资源| a在线视频免费观看| 婷婷五月深深久久精品| 三级理论在线播放大全| 曰批全过程免费视频观看免费软件| 亚洲国产精品成人久久久 |