首页 Web前端 Python Java C++

+

当前位置：
首页
AI 模型评测

Web前端
Tailwind CSS
前端框架
前端组件库
Python
Java
Node JS
运维工具

PubMedQA
生物医学研究问答数据集和模型得分排行榜
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
LLMEval3
由复旦大学NLP实验室推出的大模型评测基准
Chatbot Arena
以众包方式进行匿名随机对战的LLM基准平台
HELM
斯坦福大学推出的大模型评测体系
MMBench
全方位的多模态大模型能力评测体系
CMMLU
一个综合性的大模型中文评估基准
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
SuperCLUE
中文通用大模型综合性测评基准
FlagEval
智源研究院推出的FlagEval（天秤）大模型评测平台
C-Eval
一个全面的中文基础模型评估套件
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
MMLU
大规模多任务语言理解基准

AI 模型评测

暂无简介

热门工具

Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
MMLU
大规模多任务语言理解基准
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
C-Eval
一个全面的中文基础模型评估套件
HELM
斯坦福大学推出的大模型评测体系
SuperCLUE
中文通用大模型综合性测评基准
MMBench
全方位的多模态大模型能力评测体系
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
PubMedQA
生物医学研究问答数据集和模型得分排行榜
Chatbot Arena
以众包方式进行匿名随机对战的LLM基准平台

一站式编程工具导航

一站式编程工具导航平台，收录最新、最全的开发资源。深度覆盖Python、Java、C++、C#、Web前端等主流编程语言，提供高效检索与下载服务，致力于成为程序员的首选工具站。

Contacts

Email:

guren_d@hotmail.com

备案号:

粤ICP备2024207953号

© Copyright 2024 - 2025 cabbage-nav-program.pages.dev. All rights reserved.

隐私协议
用户协议
关于我们

友情链接：

AI工具站