5. support metrics 6. 支持自定义评测 7. Reference TinyEval 实现一个简单的LLM评测框架,该框架是一个双阶段的评测体系,我们称之为TinyEval,包含了LLM通用评测的核心功能,支持生成式、判别式、选则式评测问题,框架主要包含inference与eval部分,目的是为了帮助大家更好的力即LLM评测的原理与实现。 感谢