跳转至主要内容
Ctrl+K
← 返回 FlagOS 文档
← 返回 FlagOS 文档
VLLM-Plugin-FL 文档中心 - Home VLLM-Plugin-FL 文档中心 - Home
  • vllm-plugin-FL 文档

📑 发布说明

  • 发布说明

📚 指南

  • vllm-plugin-FL 概览
    • 特性
    • 算子调度机制
  • 快速入门
    • 要求
    • 安装运行推理任务所需的软件
    • 运行推理任务
    • Qwen2.5-1.5B 在 Iluvatar BI-V150 上的推理
  • 算子调度用户指南
    • 快速开始
    • 配置后端选择
    • 策略上下文管理
    • 添加新算子和厂商后端

📖 参考文档

  • 调度 API 参考
  • Repository
  • Suggest edit

快速入门

快速入门#

本节介绍安装 vllm-plugin-FL 的要求,并指导您在不同硬件平台上安装 vllm、vllm-plugin-FL 以及运行推理任务。

  • 要求
    • 软件要求
    • 支持的硬件平台
    • 支持的模型
  • 安装运行推理任务所需的软件
    • 从源代码安装
    • 从 Docker 镜像安装
    • (可选)调度算子
  • 运行推理任务
    • 运行离线批量推理
    • 运行服务推理任务
  • Qwen2.5-1.5B 在 Iluvatar BI-V150 上的推理
    • 目录
    • 1. 模型概览
    • 2. 环境要求
    • 3. 安装
    • 4. 模型下载
    • 5. 推理脚本
    • 6. 运行说明
    • 7. 参数调优
    • 8. 基准性能
    • 9. 常见问题

上一页

算子调度机制

下一页

要求

作者: FlagOS Community

© Copyright 2025-2026, FlagOS Community.

最后更新于 6月 26, 2026.