功能特性#

KernelGenBench内核 生成评估提供全面的功能支持。

多源评估#

来自 ATen、vLLM 和 cuBLAS 来源的 210 个算子。

→ 详情请参阅多源算子

多芯片支持#

支持 6 个硬件平台(NVIDIA、Ascend、MUSA、Hygon、Iluvatar、MetaX),具备自动检测功能。

→ 详情请参阅多芯片支持

两条评估赛道#

赛道

目的

LLM 赛道

Pass@K 评估

智能体赛道

迭代生成

防作弊验证#

三层机制(AST 扫描、Ghost 回放、硬件分析)。

→ 详情请参阅防作弊架构

评估指标#

精度、加速比、Token 成本、实际运行时间。

→ 详情请参阅评估指标