搜索历史
热门标签

全球大模型最新排名揭晓,Google、OpenAI、DeepSeek领跑

天使
2025-03-28 10:20

2025年3月28日,加州大学伯克利分校的 SkyLab 和 LMArena 研究团队开发的 Chatbot Arena 发布了最新的全球大语言模型(LLM)排行榜。该排行榜基于超过 100 万次用户投票,采用 Bradley-Terry 统计模型进行评分,对最佳 AI 聊天机器人进行实时排名。在此次排名中,Google、OpenAI 和 DeepSeek 等公司的大模型表现突出。其中,Google 的 Gemini-2.0-Pro-Exp-02-05 和 Gemini-2.0-Flash-Thinking-Exp-01-21 进入前五,OpenAI 的 o1-2024-12-17 也表现不俗。


具体排名可参考实时链接:https://lmarena.ai/?leaderboard


排名亮点:


  • Google Gemini 系列:持续强势,共有五款模型进入前 15 名,Gemini-2.0-Pro-Exp-02-05 以 1380 分的 Arena Score 进入前五。

  • OpenAI:稳固领先地位,o1-preview、o3-mini-high 和 o3-mini 等多款模型保持在排行榜前列。

  • DeepSeek 的 DeepSeek-R1:以 1360 分排名第七,巩固其在开源 AI 领域的影响力。

  • 中国企业:阿里巴巴的 Qwen2.5-Max 和 QwQ-32B 均进入前 15,智谱 AI 的 GLM-4-Plus-0111 也表现亮眼。

  • Anthropic 的 Claude 3.7 Sonnet:进入前 20,凸显其在思维链推理(thinking-32k)方面的优化。


此次榜单不仅反映了各大 AI 公司的技术实力,也显示出开源模型的崛起。DeepSeek、Cohere、StepFun 等团队均有开源或半开源模型跻身排行榜,表明开源生态正在挑战封闭专有模型的主导地位。未来,大模型的竞争将继续围绕推理能力、响应速度、训练数据质量以及多模态扩展展开,谁能最终问鼎 AI 之巅,仍有待观察。


天使
文章 867 
浏览 914367 

相关资讯

更多 »