Geek 0 关注者 关注 1周前 Groq 出品: OpenBench 为大语言模型提供标准化、可复现的基准测试,跨越20多个涵盖知识、推理、编程和数学的开源评估框架。 #Groq #OpenBench #大语言模型 #基准测试 #开源评估框架 前往原网页查看