灵夕翻译
-
专业文档翻译平台
前往体验>>
首页
分类
Apps
排行榜
MCP
博客教程
AI备案查询
全网AI快讯
实时
提交产品
登录
首页
/
全部分类
/
大模型
/
大模型评测
/
2025年最好的
9
个大模型评测工具
大模型评测工具帮助用户对各种大规模机器学习模型进行评估与分析。通过自动化的性能评测、对比分析等功能,用户能够精准了解模型的效果、性能瓶颈以及优化空间,为模型选择和改进提供数据支持。
热门领域
创作
图像
视频
音频
服务
大模型
开发
营销
企业
学习
办公工作
设计
全部产品
大语言模型
AI模型托管
DeepSeek
开源大模型
国产大模型
教育大模型
多模态大模型
语音大模型
视频大模型
大模型评测
绘画大模型
全部地区
全部类型
最热
Chatbot Arena
LMArena.ai 的核心目标是通过用户偏好评估 AI 模型,构建公开的排行榜,促进 AI 技术的进步。
MMLU
MMLU 是一个广泛使用的基准,测试模型在多个学科和任务上的语言理解能力,涵盖高中、大学和专业水平的知识。
OpenCompass司南 - 评测榜单
OpenCompass 平台的 LLM(大语言模型)排行榜页面,由 OpenCompass 社区维护。
AGI-Eval评测社区
是由上海交通大学、同济大学、华东师范大学以及 DataWhale 等高校和机构合作推出的大模型评测社区
MMBench
MMBench 的官方排行榜页面,由 OpenCompass 社区维护。
Prompt Llama
帮助用户评估不同模型在生成图像时的表现差异
C-Eval 排行榜
主要用于展示不同大语言模型(LLMs)在多层次、多学科中文任务中的综合能力排名。
Ai-Ceping
领先的大模型评测平台
Open LLM Leaderboard
由 open-llm-leaderboard 团队创建。它的主要目的是跟踪、排名和评估开源大语言模型(LLMs)和聊天机器人,为用户提供一个透明、可比较的平台,以了解不同模型的性能表现。
上一页
1
下一页