美团 LongCat 开源 General 365：树立推理评测新标尺

来源：OSChina 时间：2026-05-15 16:01:42

这份基准将焦点从 “学科推理” 拓展到 “通用推理”，第一次清晰地勾勒出了当前大模型在通用逻辑推理上的真实能力边界。