方法#

KernelGenBench 中可用的智能体方法。

概述#

方法

描述

模型支持

naive_cc

单次 Claude Code 调用

Opus, GLM, Qwen, MiniMax

normal_cc

Claude Code + 自验证循环

Opus, GLM, Qwen, MiniMax

naive_opencode

单次 OpenCode 调用

Opus, GLM, Qwen, MiniMax

normal_opencode

OpenCode + 自验证循环

Opus, GLM, Qwen, MiniMax

AutoKernel

Automated kernel optimization (standalone: test_autokernel.sh)

GLM, Qwen

AKO4ALL

Kernel optimization for all operators (standalone: test_ako4all.sh)

Opus

cuda-optimized-skill

CUDA optimization with strategy memory (standalone)

Opus

基础智能体框架#

Claude Code#

变体

描述

naive_cc

单次生成过程

normal_cc

生成 + 自验证 + 迭代修复

最适用于:高准确率需求

OpenCode#

变体

描述

naive_opencode

单次生成过程

normal_opencode

生成 + 自验证循环

最适用于:替代智能体框架

内核专用智能体#

AutoKernel#

自动化内核优化流程:

  • 专注于性能优化

  • 支持多种模型(GLM-5.0、Qwen3.5)

  • 最高的加速效果

AKO4ALL#

针对所有算子的内核优化:

  • 使用 Opus-4.6

  • 全面的算子覆盖

  • 准确率与加速的良好平衡

cuda-optimized-skill#

带策略记忆的 CUDA 优化:

  • 利用历史优化策略

  • 专为 CUDA 内核优化设计

  • 基于策略的方法以提升性能

选择方法#

目标

推荐方法

高准确率

normal_cc(Claude Code)

高加速

AutoKernel (Qwen)

平衡性能

AKO4ALL

经济高效

naive_cc