安装#
Docker 镜像(推荐)#
平台 |
镜像 |
内容 |
|---|---|---|
NVIDIA GPU |
|
torch 2.11.0+cu128, torch_fl 0.1.0, flag_gems 5.0.2, triton 3.6.0 |
华为昇腾 |
|
torch 2.11.0+CPU, torch_npu, torch_fl |
# NVIDIA
docker pull harbor.baai.ac.cn/flagos21-release/pytorch-plugin-fl:v0.1.0-rc2-nvidia
# 华为昇腾
docker pull harbor.baai.ac.cn/flagos21-release/pytorch-plugin-fl:v0.1.0-rc2-ascend
从源码构建#
CUDA 平台#
git clone https://github.com/flagos-ai/PyTorch-Plugin-FL.git && cd PyTorch-Plugin-FL
pip install -e . --no-build-isolation
MACA 平台#
# 设置 MACA cu-bridge 库路径,根据您环境中实际的 cu-bridge 路径进行调整
export LD_LIBRARY_PATH=/opt/maca/tools/cu-bridge/lib:$LD_LIBRARY_PATH
ACCELERATOR=maca pip install -e . --no-build-isolation
华为昇腾平台#
# 确保已安装 CANN 工具包并已 source 环境
# (通常为:source /usr/local/Ascend/ascend-toolkit/set_env.sh)
ACCELERATOR=ascend FLAGGEMS_KERNEL=0 CUDA_KERNEL=0 ASCEND_KERNEL=1 \
pip install --no-build-isolation -vvv -e .
在昇腾平台上,FlagGems 和 CUDA 内核被禁用。仅编译昇腾内核后端(ACL NN API)。
构建环境变量#
变量 |
描述 |
|---|---|
|
硬件平台: |
|
CUDA 工具包路径 |
|
MACA SDK 路径(默认 |
|
CANN 工具包路径(默认 |
|
FlagGems C++ 库路径(启用低开销 C++ 调度) |
|
启用 FlagGems 内核构建( |
|
启用 CUDA 内核构建( |
|
启用昇腾内核构建( |
运行时环境变量#
变量 |
描述 |
|---|---|
|
设为 |
|
FlagGems 源码目录(当 C++ 原生 API 算子路由到 |
|
覆盖 |
|
设为 |
|
逐算子后端覆盖(算子名称中的 |