热点资讯
- 牛牛app 指鹿为马的赵高,他真的是太监吗?他有何能力真的全靠拍马屁吗?
- 牛牛app 钱学森吃饭倏地惊呼这菜气息隔离!简直化验出剧毒,谁下的难办?
- 抢庄牛牛 尼帕病毒的自述
- 抢庄牛牛 人到中年养生别瞎忙!孙思邈 “五难、十二少”,道尽健康真谛
- 牛牛 拍案·打击无人机“黑飞”|助人“自由飞行” 致己身陷囹圄
- 抢庄牛牛 她带三个女儿嫁大明星,恩爱40年却未被继女认同,百年后真相揭晓
- 牛牛app 不啻英语! 童元戎AI凭这3大上风, 成3-8岁家庭刚需
- 抢庄牛牛 华尔街濒临新风险: 欧洲投资者“罢买”好意思国财富
- 牛牛 专家销量首超日本!中国车企登顶背后,长三角作念了什么?
- 抢庄牛牛app A股最近, 小盘成长占优
抢庄牛牛app 全球中文大模型战力榜发布:前三被海外包揽 国产有惊喜
- 发布日期:2026-02-05 12:09 点击次数:61

快科技2月4日消息,今天,SuperCLUE发布2025年年度中文大模型基准测评报告。
23个国内外模型参与角逐,覆盖数学推理、科学推理、代码生成等六大核心维度。
从结果来看,海外闭源模型依旧占据头部位置,Anthropic旗下的Claude-Opus-4.5-Reasoning以68.25分位居榜首。
{jz:field.toptypename/}谷歌的Gemini-3-Pro-Preview和OpenAI的GPT-5.2(high)分别以65.59分、64.32分紧随其后,包揽前三名。
不过,国产大模型正加速从跟跑向并跑迈进。国内开源最佳模型Kimi-K2.5-Thinking 和闭源最佳模型Qwen3-Max-Thinking,牛牛游戏分别以61.50分、60.61分位列全球第四和第六。
在部分细分领域,国产模型表现亮眼,比如Kimi-K2.5-Thinking在代码生成任务中以53.33分夺冠,Qwen3-Max-Thinking在数学推理任务中与Gemini-3-Pro-Preview同获80.87分,并列全球第一。
从整体格局看,海内外开闭源模型差异显著。闭源阵营呈现海外领先、国产追赶态势,开源阵营则是国产主导、海外式微,国内开源模型Top5均大幅领先海外开源模型。
推荐资讯
- 牛牛游戏 环球圆桌对话: 好意思国与北约走到分谈扬镳十字街头?2026-04-13
- 抢庄牛牛 独家:阿里认领“昌盛马”!下周上架百真金不怕火,白名单制有限洞开2026-04-13
- 牛牛 范戴克: 咱们太久莫得零封了, 下周必须全力打好欧冠2026-04-12
- 抢庄牛牛app 034期明皇福彩3D预测奖号:大小分析2026-04-12
- 牛牛游戏app 等电位衔接器和火花流毒保护器的分歧2026-04-11
- 牛牛游戏 硕贝德子公司赎回并续投9200万元闲置召募资金 累计未赎回余额1.41亿元2026-04-11
