FlagEval FlagEval是北京智源人工智能研究院推出的一个大模型评测体系及开放平台,FlagEval覆盖自然语言处理(NLP)、计算机视觉(CV)、语音(Audio)和多模态(Multimodal)四大领域,提供多维度评测。 00 AI数据模型评测# FlagEval# 大模型评测体系