什么是 KernelGenBench？

什么是 KernelGenBench？#

KernelGenBench 是一个用于评估 LLM 和智能体驱动的 Triton 内核生成的基准框架，支持多种硬件平台。它是 FlagOS 的组成部分——一个统一的开源 AI 系统软件栈。

KernelGenBench 概览

KernelGenBench 提供了一种标准化的方法来衡量 AI 模型生成 GPU 内核代码的有效性。生成的 Triton 内核可直接用于生产环境，从而实现对实际应用性的直接评估。

该基准填补了 AI 生态系统中的一个关键空白：虽然 LLM 在自动化内核开发方面展现出潜力，但之前缺乏一种全面的方法来评估其在多样化算子来源和异构硬件平台上的有效性。

KernelGenBench 由两个互补的子基准组成：

子基准	描述
KernelGenBench-MS	多源评估，包含 210 个算子
KernelGenBench-MC	多芯片评估，覆盖 6 个硬件平台

项目	描述
awesome-LLM-driven-kernel-generation	AI 驱动内核生成综述
KernelGen	用于自动化 Triton 内核生成的高性能平台