特性

特性#

FlagScale 提供统一工具集,覆盖大语言模型、多模态模型和具身智能模型的完整生命周期。它在单一配置和 CLI 接口下集成了多个开源后端引擎,支持在不同芯片厂商间一致运行。主要特性包括:

  • 统一 CLI:以单一 flagscale 命令作为所有操作的入口——训练、推理、服务和强化学习——提供跨 NVIDIA GPU、昇腾 NPU、MetaX MUSA 等平台的统一多芯片支持。

  • 训练:通过与 Megatron-LM-FL 和 TransformerEngine-FL 协作,全面支持 DeepSeek-V3/V4、Qwen2/2.5/3、Qwen2.5-VL、QwQ、LLaMA2/3/3.1、LLaVA-OneVision/1.5、Mixtral、RWKV、Aquila 等模型的分布式训练。

  • 推理与服务:通过与 vllm-plugin-FL 协作,支持 DeepSeek-V3、DeepSeek-R1、Qwen2.5/3、Qwen2.5-VL、Qwen3-Omni、QwQ、Grok2、Kimi-K2 等模型的高性能推理与服务。

  • 强化学习:通过与 VeRL-FL 协作,支持 Qwen3-VL、Qwen2.5-VL、GR00T N1.5、DeepSeek Engram 等模型的强化学习工作流。

  • 可扩展的跨芯片通信:通过与 FlagCX 协作实现。

  • 具身智能工作负载支持:通过与 FlagOS-Robo 协作实现。

  • 自动并行优化:针对不同模型、集群配置和芯片架构,自动搜索并选择最优的并行策略、优化方法和内存配置组合——使用户能够以全自动、零投入的方式获得最佳的模型并行训练和推理性能。