智能体赛道

智能体赛道#

智能体赛道评估迭代生成、验证和优化内核的编程智能体。

测试内容#

具有执行反馈的自主调试和优化能力。

适用场景#

  • 测试智能体框架(Claude Code、OpenCode)

  • 评估内核专用智能体(AutoKernel、AKO4ALL)

  • 生产级内核生成

快速开始#

cd agent_bench
bash test_ops.sh add --device-count 1