FlagRelease 发布指南#

什么是 FlagRelease#

FlagRelease 是一套自动化模型评测与发布流水线,可在 NVIDIA、昇腾、沐曦、海光等 GPU 平台上完成:

  • 模型环境验证

  • 精度评测

  • 性能评测

  • 自动发布

适用于模型适配完成后的验证与发布流程。


环境准备#

操作系统要求#

  • 操作系统:Ubuntu 20.04+ 或 CentOS 7+(Linux 环境)

  • GPU 驱动:已安装目标厂商的 GPU 驱动

  • 网络:可访问 Docker Hub、ModelScope、HuggingFace、GitHub

  • Docker 环境:确保 Docker 已安装并正在运行

  • 模型建议:opus4.6

安装 Node.js#

sudo apt remove libnode-dev nodejs
apt update
curl -fsSL https://deb.nodesource.com/setup_20.x | bash -
apt install -y nodejs

安装 Claude Code#

npm install -g @anthropic-ai/claude-code

配置 Claude Code#

编辑:

~/.claude/settings.json

填写:

{
  "env": {
    "ANTHROPIC_BASE_URL": "<URL>",
    "ANTHROPIC_AUTH_TOKEN": "<TOKEN>",
    "ANTHROPIC_MODEL": "<MODEL>"
  }
}

获取代码#

git clone https://github.com/Lxiparer/FlagRelease.git
cd FlagRelease

运行流水线#

命令格式#

bash prompts/run_pipeline.sh \
    <IMAGE> \
    <MODEL_NAME> \
    <MODELSCOPE_TOKEN> \
    <HF_TOKEN> \
    <GITHUB_TOKEN> \
    <HARBOR_USER> \
    <HARBOR_PASSWORD> \
    [--model-path PATH] \
    [--flagrelease-token TOKEN]

需要修改的参数#

通常只需要关注以下三项:

镜像#

根据硬件选择对应镜像。

平台

镜像

NVIDIA(vLLM 0.20.2)

harbor.baai.ac.cn/flagrelease-public/nv_vllm-0.20.2_gems_tree:202605131138

昇腾(vLLM 0.13.0)

harbor.baai.ac.cn/flagrelease-public/hw_gems_5.0.2_tree_0.5.0-ascend3.2:2605131051

沐曦(vLLM 0.13.0)

harbor.baai.ac.cn/flagrelease-public/metax_gems_tree:2605061746

海光(vLLM 0.13.0)

harbor.baai.ac.cn/flagrelease-public/hy_gems_tree:2605111710

天数(vLLM 0.13.0)

harbor.baai.ac.cn/flagrelease-public/tianshu_gems_5.0.2_0.5.1-iluvatar3.1_vllm_fl_0.0.0:2605201817

摩尔(vLLM 0.13.0)

harbor.baai.ac.cn/flagrelease-public/mthreads_gt_gems_5.0.1rc0_tree_0.5.0-mthreads3.1:2605151801


模型名称#

需与 HuggingFace 或 ModelScope 保持一致。

例如:

Qwen/Qwen2-7B-Instruct
HY/Hy-MT2-7B
meta-llama/Llama-3.1-8B

模型路径(可选)#

如果本地已有模型:

--model-path /mnt/workspace/models/Qwen/Qwen2-7B-Instruct

未指定时会自动搜索或下载。


运行示例#

bash prompts/run_pipeline.sh \
    harbor.baai.ac.cn/flagrelease-public/nv_gems_tree:04081426 \
    Qwen/Qwen2-7B-Instruct \
    <MODELSCOPE_TOKEN> \
    <HF_TOKEN> \
    <GITHUB_TOKEN> \
    <HARBOR_USER> \
    <HARBOR_PASSWORD> \
    <--model-path /mnt/workspace/models/Qwen/Qwen2-7B-Instruct>

后台运行#

推荐使用:

nohup bash prompts/run_pipeline.sh ... \
    > pipeline.log 2>&1 &

查看日志:

tail -f pipeline.log

查看进程:

ps -ef | grep run_pipeline

评测结果#

流水线完成后,结果保存在:

/data/flagos-workspace/<MODEL_NAME>/

目录结构:

results/    评测结果
traces/     推理轨迹
logs/       日志
config/     配置备份

常见问题#

Docker 无法连接#

Cannot connect to the Docker daemon

启动 Docker:

sudo systemctl start docker

模型下载失败#

检查:

  • 模型名称是否正确

  • 网络是否可访问 ModelScope/HuggingFace

  • --model-path 是否填写正确


Claude Code 鉴权失败#

检查:

~/.claude/settings.json

中的:

ANTHROPIC_BASE_URL
ANTHROPIC_AUTH_TOKEN
ANTHROPIC_MODEL

配置是否正确。


查看详细日志#

tail -f pipeline.log

或:

tail -f /data/flagos-workspace/<MODEL_NAME>/logs/pipeline.log

支持平台#

平台

状态

NVIDIA

昇腾

沐曦

海光

天数智芯

开发中

昆仑芯

开发中

摩尔线程

开发中