字节 veRL 团队宣布开源了一个为通用 Agent 打造的统一训练框架 Uni-Agent,其核心目标是构建一个贯通构建、运行与训练完整流程的系统,旨在: 让开发者可以更轻松地构建自己的 Agent; 让系统可以稳定地支撑大规模任务运行; 让交互过程能够自然接入训练闭环,通过强化学习持续进化。 根据介绍,“Uni”包含两层含义:U...