用例库

浏览所有评测维度和用例,查看各模型的生成结果对比

L-QA xsct-l

综合分析题

测试综合分析能力

L-QA xsct-l

前沿科技

测试前沿知识

L-QA xsct-l

哲学问题

测试哲学思辨能力

L-QA xsct-l

时事分析

测试时事理解能力

L-QA xsct-l

对比分析

测试对比分析能力

L-QA xsct-l

跨学科问答

测试跨学科知识整合

L-QA xsct-l

科学原理

测试科学知识

L-QA xsct-l

历史知识

测试历史知识

L-QA xsct-l

常识问答

测试基础常识