算子#
KernelGenBench 中算子来源的参考列表。
ATen 算子(110 个)#
选择标准#
从 2,907 个模型训练轨迹中选出使用频率最高的 50 个算子
均匀采样 60 个长尾算子
示例#
类别 |
算子 |
|---|---|
算术 |
|
归约 |
|
线性 |
|
归一化 |
|
激活 |
|
形状操作 |
|
vLLM 算子(50 个)#
类别#
类别 |
描述 |
|---|---|
注意力 |
|
KV 缓存 |
缓存管理内核 |
量化 |
FP8、AWQ 内核 |
归一化 |
RMS 归一化、融合归一化 |
示例#
算子 |
描述 |
|---|---|
|
内存高效注意力 |
|
融合归一化 |
|
位置编码 |
cuBLAS 算子(50 个)#
GEMM 系列(14 种变体)#
精度 |
标准 |
StridedBatched |
Batched |
|---|---|---|---|
Float32 |
|
|
|
Float64 |
— |
|
|
Complex64 |
|
|
— |
Complex128 |
— |
|
|
Float16 |
— |
|
|
其他 BLAS 例程#
GEMV(矩阵-向量乘法)
SYRK(对称秩-k 更新)
TRSM(三角求解)
以及跨多种精度的其他例程