HEML Holistic Evaluation of Language Models Holistic Evaluation of Language Models(HELM)是一个由斯坦福大学提出的语言模型综合评估框架。HELM对语言模型感兴趣的潜在应用场景(即用例)进行了广泛的分类。这些场景涵盖了多个任务、领域和语言,以确保评估的全面性。 10 AI数据模型评测# HEML# 斯坦福大学# 语言模型整体评估