命令#
智能体赛道评估的 CLI 命令。
基本用法#
cd agent_bench
# Single operator
bash test_ops.sh add --device-count 1
# Multiple operators
bash test_ops.sh add,softmax,mul --device-count 4
# All operators
bash test_ops.sh --device-count 8
方法选择#
# Naive method (single call)
bash test_ops.sh add -m naive_cc --device-count 1
# Normal method (with verification loop)
bash test_ops.sh add -m normal_cc --device-count 1
# OpenCode methods
bash test_ops.sh add -m naive_opencode --device-count 1
bash test_ops.sh add -m normal_opencode --device-count 1
专用智能体#
# AutoKernel
bash test_autokernel.sh add --device-count 1
# AKO4ALL
bash test_ako4all.sh add --device-count 1
# CUDA Optimized Skill
bash test_cuda_optimized_skill.sh add --device-count 1
参数#
参数 |
默认值 |
描述 |
|---|---|---|
|
全部 |
逗号分隔的算子名称 |
|
|
要使用的数据集 |
|
|
智能体方法 |
|
8 |
GPU 数量 |
|
600 |
每个算子的超时时间(秒) |
|
关闭 |
跳过提示生成 |
|
关闭 |
跳过验证 |
|
关闭 |
启用详细输出 |
输出#
结果保存到 agent_bench/runs/<run_name>/:
文件 |
描述 |
|---|---|
|
实时进度跟踪 |
|
生成的内核文件 |
|
验证结果 |
|
执行日志 |
监控进度#
# Watch progress file
cat agent_bench/runs/<run_name>/progress.json
分析结果#
python scripts/analyze/analyze.py agent_bench/runs/<run_dir>/