特性

目录

特性#

插件系统#

Megatron-LM-FL 引入了基于插件的架构，无需修改上游代码即可实现平台特定的实现：

@overridable — 将 megatron.core 中的方法或函数标记为可被插件替换
@override — 注册替换 @overridable 目标的插件实现
多供应商调度 — 通过 MG_FL_PREFER 环境变量进行运行时供应商选择，四级回退：首选供应商 → 默认供应商 → 唯一供应商 → 无

多平台支持#

通过 PlatformBase 进行硬件抽象，支持多个平台的实现：

NVIDIA — CUDA GPU（默认，完整功能支持）
MetaX — MetaX GPU
Moore Threads — MUSA GPU
TXDA — Tsingmicro GPU
NPU — Ascend NPU

DeepSeek V4 支持#

完整的 DeepSeek V4 架构训练支持（CSA/HCA、Hash Router、mHC、Engram、MTP）。

上游兼容性#

保留完整的上游 Megatron-LM 功能
Core 0.17.0 同步，包含 FlagScale 特定补丁（engram、异构流水线、平台插件）
高级并行策略：TP、PP、DP、EP、CP
混合精度：FP16、BF16、FP8
GPU 优化内核

CI/CD#

多平台单元和功能测试（CUDA + MetaX）
Qwen3 基准测试门禁，使用 A100 黄金值
Lint 门禁：pylint >= 9.0
向 FlagCICD 平台上报覆盖率