用例库

浏览所有评测维度和用例,查看各模型的生成结果对比

L-ReasoningChain xsct-l

元认知推理

测试高阶认知推理

L-ReasoningChain xsct-l

博弈论推理

测试策略推理能力

L-ReasoningChain xsct-l

悖论分析

测试悖论理解与分析

L-ReasoningChain xsct-l

因果链推理

测试因果关系推理

L-ReasoningChain xsct-l

约束条件推理

测试约束满足问题

L-ReasoningChain xsct-l

多步骤问题求解

测试复杂多步推理

L-ReasoningChain xsct-l

类比推理

测试类比关系推理

L-ReasoningChain xsct-l

条件推理

测试条件逻辑推理

L-ReasoningChain xsct-l

简单推理链

测试基础逻辑推理