URO-Bench URO-Bench 是一个全面的基准测试,旨在评估端到端语音对话模型(SDMs)的性能。该基准测试涵盖多语言、多轮对话和副语言学等方面的评估,是首个在语音到语音(S2S)场景中提供如此广泛评估的基准。 120 AI工具# URO-Bench