这份基准将焦点从 “学科推理” 拓展到 “通用推理”,第一次清晰地勾勒出了当前大模型在通用逻辑推理上的真实能力边界。