OpenCompass

共 2 篇网址

排序

发布更新浏览点赞

OpenCompass司南

OpenCompass，也被称为“司南”，是由上海人工智能实验室推出的一款开源的大模型评测体系。评测体系从多种视角出发，量化大模型的能力。评估维度包括但不限于目标检测、文字识别、动作识别、图像理解和关系推理等基础能力，还涉及艺术与设计、商业、科学、健康与医学、人文与社会科学、技术与工程、数学推理等多个专业领域。

320

AI数据模型评测 # OpenCompass # 司南 # 大模型评测

MMBench

MMBench是由OpenCompass社区开发的一款AI工具，旨在评估大规模视觉语言模型（LVLMs）的多模态理解能力。

300

AI数据模型评测 # MMBench # OpenCompass # 多模态模型评估工具