前置条件#
智能体客户端版本
Claude Code 版本 2.1 及以上
OpenClaw 版本 2026.3.2 及以上
VSCode 需启用 Github Copilot
环境准备
预安装依赖包:请预先安装
torch、triton和pytest软件包,以便在不同硬件平台上进行 Kernel 测试。通过以下 Python 代码导入torch已检测 CUDA 是否可用:import torch # 检查 CUDA 是否可用 print("CUDA available:", torch.cuda.is_available()) # 如果可用,执行一个简单的 GPU 计算 if torch.cuda.is_available(): x = torch.tensor([1.0, 2.0, 3.0]).cuda() y = torch.tensor([4.0, 5.0, 6.0]).cuda() z = x + y # 触发 CUDA kernel print("Result:", z) print("Device:", z.device) else: print("CUDA is not available")
针对华为昇腾(Huawei Ascend)平台:除了安装和导入标准的
torch包外,还需安装并导入torch_npu。
预安装 FlagTree:请预先安装 FlagTree。