OpenCompass司南 OpenCompass,也被称为“司南”,是由上海人工智能实验室推出的一款开源的大模型评测体系。评测体系从多种视角出发,量化大模型的能力。评估维度包括但不限于目标检测、文字识别、动作识别、图像理解和关系推理等基础能力,还涉及艺术与设计、商业、科学、健康与医学、人文与社会科学、技术与工程、数学推理等多个专业领域。 00 AI数据模型评测# OpenCompass# 司南# 大模型评测
MMBench MMBench是由OpenCompass社区开发的一款AI工具,旨在评估大规模视觉语言模型(LVLMs)的多模态理解能力。 00 AI数据模型评测# MMBench# OpenCompass# 多模态模型评估工具