快捷AI导航
首页Web前端PythonJavaC++
+
  1. 当前位置:
  2. 首页
  3. AI 模型评测
  • Web前端
  • Tailwind CSS
  • 前端框架
  • 前端组件库
  • Python
  • Java
  • Node JS
  • 运维工具
  • PubMedQA
    生物医学研究问答数据集和模型得分排行榜
  • H2O EvalGPT
    H2O.ai推出的基于Elo评级方法的大模型评估系统
  • LLMEval3
    由复旦大学NLP实验室推出的大模型评测基准
  • Chatbot Arena
    以众包方式进行匿名随机对战的LLM基准平台
  • HELM
    斯坦福大学推出的大模型评测体系
  • MMBench
    全方位的多模态大模型能力评测体系
  • CMMLU
    一个综合性的大模型中文评估基准
  • OpenCompass
    上海人工智能实验室推出的大模型开放评测体系
  • SuperCLUE
    中文通用大模型综合性测评基准
  • FlagEval
    智源研究院推出的FlagEval(天秤)大模型评测平台
  • C-Eval
    一个全面的中文基础模型评估套件
  • Open LLM Leaderboard
    Hugging Face推出的开源大模型排行榜单
  • MMLU
    大规模多任务语言理解基准

AI 模型评测

暂无简介

热门工具

  • Open LLM Leaderboard
    Open LLM Leaderboard
    Hugging Face推出的开源大模型排行榜单
  • MMLU
    MMLU
    大规模多任务语言理解基准
  • H2O EvalGPT
    H2O EvalGPT
    H2O.ai推出的基于Elo评级方法的大模型评估系统
  • C-Eval
    C-Eval
    一个全面的中文基础模型评估套件
  • HELM
    HELM
    斯坦福大学推出的大模型评测体系
  • SuperCLUE
    SuperCLUE
    中文通用大模型综合性测评基准
  • MMBench
    MMBench
    全方位的多模态大模型能力评测体系
  • OpenCompass
    OpenCompass
    上海人工智能实验室推出的大模型开放评测体系
  • PubMedQA
    PubMedQA
    生物医学研究问答数据集和模型得分排行榜
  • Chatbot Arena
    Chatbot Arena
    以众包方式进行匿名随机对战的LLM基准平台
一站式编程工具导航

一站式编程工具导航平台,收录最新、最全的开发资源。深度覆盖Python、Java、C++、C#、Web前端等主流编程语言,提供高效检索与下载服务,致力于成为程序员的首选工具站。

Contacts

Email:

guren_d@hotmail.com

备案号:

粤ICP备2024207953号

© Copyright 2024 - 2025 cabbage-nav-program.pages.dev. All rights reserved.

  • 隐私协议
  • 用户协议
  • 关于我们

友情链接:

  • AI工具站