方法#
KernelGenBench 中可用的智能体方法。
概述#
方法 |
描述 |
模型支持 |
|---|---|---|
|
单次 Claude Code 调用 |
Opus, GLM, Qwen, MiniMax |
|
Claude Code + 自验证循环 |
Opus, GLM, Qwen, MiniMax |
|
单次 OpenCode 调用 |
Opus, GLM, Qwen, MiniMax |
|
OpenCode + 自验证循环 |
Opus, GLM, Qwen, MiniMax |
AutoKernel |
Automated kernel optimization (standalone: |
GLM, Qwen |
AKO4ALL |
Kernel optimization for all operators (standalone: |
Opus |
cuda-optimized-skill |
CUDA optimization with strategy memory (standalone) |
Opus |
基础智能体框架#
Claude Code#
变体 |
描述 |
|---|---|
|
单次生成过程 |
|
生成 + 自验证 + 迭代修复 |
最适用于:高准确率需求
OpenCode#
变体 |
描述 |
|---|---|
|
单次生成过程 |
|
生成 + 自验证循环 |
最适用于:替代智能体框架
内核专用智能体#
AutoKernel#
自动化内核优化流程:
专注于性能优化
支持多种模型(GLM-5.0、Qwen3.5)
最高的加速效果
AKO4ALL#
针对所有算子的内核优化:
使用 Opus-4.6
全面的算子覆盖
准确率与加速的良好平衡
cuda-optimized-skill#
带策略记忆的 CUDA 优化:
利用历史优化策略
专为 CUDA 内核优化设计
基于策略的方法以提升性能
选择方法#
目标 |
推荐方法 |
|---|---|
高准确率 |
|
高加速 |
AutoKernel (Qwen) |
平衡性能 |
AKO4ALL |
经济高效 |
|