摘要: 7月12日消息,北京師范大學(xué)智能技術(shù)與教育應(yīng)用教育部工程研究中心(以下簡稱工程研究中心)發(fā)布北極星基礎(chǔ)教育大模型評測場V1.0及榜單。 北極星由北京師
7月12日消息,北京師范大學(xué)智能技術(shù)與教育應(yīng)用教育部工程研究中心(以下簡稱“工程研究中心”)發(fā)布“北極星”基礎(chǔ)教育大模型評測場V1.0及榜單。
“北極星”由北京師范大學(xué)智能技術(shù)與教育應(yīng)用教育部工程研究中心、北京教育科學(xué)研究院、北京智源人工智能研究院聯(lián)合建設(shè),是一款含有基礎(chǔ)教育特色的大模型評測場。
在團體標準《人工智能 基礎(chǔ)教育大模型評測指標和方法》(標準編號:T/CESA 1395-2025)的指導(dǎo)下,“北極星”具有緊扣新課標、聚焦教育應(yīng)用、多學(xué)科多場景的特點,更加關(guān)注啟發(fā)引導(dǎo)、素養(yǎng)導(dǎo)向、情境創(chuàng)設(shè)等能力評估。
目前“北極星”評測場已覆蓋初中“語文/數(shù)學(xué)/英語/物理/化學(xué)/生物/歷史/地理/信息技術(shù)”9門學(xué)科、“備/教/練/考/評/管”6大教育場景,支持110多個維度的評測。
據(jù)官方介紹,現(xiàn)有大模型大多數(shù)能力離實際應(yīng)用尚有差距,例如解題性能會因題目改寫受到較大影響,實驗探究方面效果欠佳;智能出題方面,大模型題目和解析的準確性仍有待提升。經(jīng)過測評,“北極星”評測結(jié)果與具備豐富教學(xué)經(jīng)驗的資深教師越來越相近。
“北極星”V1.0版本已正式上線(www.bnueval.com),同時其全面評測50多個主流大模型,評測榜單通過網(wǎng)站向公眾公布。
對于接下來的布局思路,據(jù)介紹“北極星”基礎(chǔ)教育大模型評測場將繼續(xù)迭代更新,以更全面的評測維度、更科學(xué)的評測方法推動基礎(chǔ)教育大模型應(yīng)用安全、健康發(fā)展。
中考結(jié)束后,家長是否在為孩子的升學(xué)而發(fā)愁?普通分數(shù)家庭其實不用太多的焦
快資訊2025-07-11 11:14:02
原標題:福州全市學(xué)校因臺風(fēng)丹娜絲停課一天,教育局:正商定后續(xù)復(fù)課安排
快資訊2025-07-09 19:36:44
原標題:青島大學(xué)凌晨通報宿管人員離世后,學(xué)生透露:事發(fā)區(qū)域正在裝空調(diào)?
快資訊2025-07-07 20:07:43
原標題:麗江失聯(lián)的20歲女大學(xué)生已確認身亡,救援隊:疑似墜崖 經(jīng)過6天的尋
快資訊2025-07-07 20:03:15
原標題:山東一高校因高溫暫停期末考試,下學(xué)期開學(xué)繼續(xù)考 7月5日晚,多名網(wǎng)
快資訊2025-07-06 16:22:51
原標題:中南財經(jīng)政法大學(xué)通報男扮女裝替考:李某揚委托他人代考擬被開除!
快資訊2025-06-26 19:01:55
原標題:全世界學(xué)歷最高的Labubu來了!清華副校長為其撥穗 6月23日上午,全世
快資訊2025-06-23 19:55:30
原標題:華中科技大學(xué)宣布獲個人匿名捐贈 1.8 億元人民幣 6 月 21 日消息,今天
快資訊2025-06-22 10:21:49