评测结果
-
首届AI高考全卷评测结果出炉,该大模型位列第一
大模型的成绩由具有高考评卷经验的教师人工评判,更加接近真实阅卷标准。评测结果显示,Qwen2-72B以语数外303分的总成绩,成为本次大模型高考“状元”,领先于GPT-4o(296分)及书生·浦语2.0文曲星(InternLM2-20B-WQX,295.5)。...
大模型的成绩由具有高考评卷经验的教师人工评判,更加接近真实阅卷标准。评测结果显示,Qwen2-72B以语数外303分的总成绩,成为本次大模型高考“状元”,领先于GPT-4o(296分)及书生·浦语2.0文曲星(InternLM2-20B-WQX,295.5)。...