FlagRelease 发布指南#
什么是 FlagRelease#
FlagRelease 是一套自动化模型评测与发布流水线,可在 NVIDIA、昇腾、沐曦、海光等 GPU 平台上完成:
模型环境验证
精度评测
性能评测
自动发布
适用于模型适配完成后的验证与发布流程。
环境准备#
操作系统要求#
操作系统:Ubuntu 20.04+ 或 CentOS 7+(Linux 环境)
GPU 驱动:已安装目标厂商的 GPU 驱动
网络:可访问 Docker Hub、ModelScope、HuggingFace、GitHub
Docker 环境:确保 Docker 已安装并正在运行
模型建议:opus4.6
安装 Node.js#
sudo apt remove libnode-dev nodejs
apt update
curl -fsSL https://deb.nodesource.com/setup_20.x | bash -
apt install -y nodejs
安装 Claude Code#
npm install -g @anthropic-ai/claude-code
配置 Claude Code#
编辑:
~/.claude/settings.json
填写:
{
"env": {
"ANTHROPIC_BASE_URL": "<URL>",
"ANTHROPIC_AUTH_TOKEN": "<TOKEN>",
"ANTHROPIC_MODEL": "<MODEL>"
}
}
获取代码#
git clone https://github.com/Lxiparer/FlagRelease.git
cd FlagRelease
运行流水线#
命令格式#
bash prompts/run_pipeline.sh \
<IMAGE> \
<MODEL_NAME> \
<MODELSCOPE_TOKEN> \
<HF_TOKEN> \
<GITHUB_TOKEN> \
<HARBOR_USER> \
<HARBOR_PASSWORD> \
[--model-path PATH] \
[--flagrelease-token TOKEN]
需要修改的参数#
通常只需要关注以下三项:
镜像#
根据硬件选择对应镜像。
平台 |
镜像 |
|---|---|
NVIDIA(vLLM 0.20.2) |
|
昇腾(vLLM 0.13.0) |
|
沐曦(vLLM 0.13.0) |
|
海光(vLLM 0.13.0) |
|
天数(vLLM 0.13.0) |
|
摩尔(vLLM 0.13.0) |
|
模型名称#
需与 HuggingFace 或 ModelScope 保持一致。
例如:
Qwen/Qwen2-7B-Instruct
HY/Hy-MT2-7B
meta-llama/Llama-3.1-8B
模型路径(可选)#
如果本地已有模型:
--model-path /mnt/workspace/models/Qwen/Qwen2-7B-Instruct
未指定时会自动搜索或下载。
运行示例#
bash prompts/run_pipeline.sh \
harbor.baai.ac.cn/flagrelease-public/nv_gems_tree:04081426 \
Qwen/Qwen2-7B-Instruct \
<MODELSCOPE_TOKEN> \
<HF_TOKEN> \
<GITHUB_TOKEN> \
<HARBOR_USER> \
<HARBOR_PASSWORD> \
<--model-path /mnt/workspace/models/Qwen/Qwen2-7B-Instruct>
后台运行#
推荐使用:
nohup bash prompts/run_pipeline.sh ... \
> pipeline.log 2>&1 &
查看日志:
tail -f pipeline.log
查看进程:
ps -ef | grep run_pipeline
评测结果#
流水线完成后,结果保存在:
/data/flagos-workspace/<MODEL_NAME>/
目录结构:
results/ 评测结果
traces/ 推理轨迹
logs/ 日志
config/ 配置备份
常见问题#
Docker 无法连接#
Cannot connect to the Docker daemon
启动 Docker:
sudo systemctl start docker
模型下载失败#
检查:
模型名称是否正确
网络是否可访问 ModelScope/HuggingFace
--model-path是否填写正确
Claude Code 鉴权失败#
检查:
~/.claude/settings.json
中的:
ANTHROPIC_BASE_URL
ANTHROPIC_AUTH_TOKEN
ANTHROPIC_MODEL
配置是否正确。
查看详细日志#
tail -f pipeline.log
或:
tail -f /data/flagos-workspace/<MODEL_NAME>/logs/pipeline.log
支持平台#
平台 |
状态 |
|---|---|
NVIDIA |
✅ |
昇腾 |
✅ |
沐曦 |
✅ |
海光 |
✅ |
天数智芯 |
开发中 |
昆仑芯 |
开发中 |
摩尔线程 |
开发中 |