KernelGenBench 文档#
一个用于评估 LLM 和智能体驱动的 Triton 内核生成的基准框架,支持多种硬件平台。
快速开始 »
Overview
了解 KernelGenBench 是什么、为什么重要,以及它能为您做什么。
Features
探索多源算子、多芯片支持、防作弊验证和评估指标。
LLM Track
使用 Pass@K 指标评估 LLM 生成 Triton 内核的能力。
Agent Track
评估能够迭代生成、验证和优化内核的编程智能体。
Reference
数据集、算子、硬件平台和技术规格。
Development
贡献指南、自定义算子和框架扩展。