FlagTree 0.1.0 发布#
亮点#
FlagTree 初始版本基于 Triton 3.1 构建,引入对多种 AI 芯片后端的支持。在早期阶段,项目旨在保持与现有后端适配方案的兼容性,同时统一代码库,实现快速的单版本多后端支持。
新特性#
多后端支持
目前支持的后端包括 iluvatar、xpu (klx)、mthreads 和 cambricon。
双编译路径支持
在此初始阶段,项目为 TritonGPU 方言和 Linalg 方言编译路径提供基本兼容性。
可插拔高差异模块架构
通过插件架构实现芯片特定的后端定制。这些非通用模块由各芯片厂商维护,并通过工程实践与 FlagTree 主仓库保持结构一致性。
交叉编译与快速验证能力
为方便开发者,FlagTree 支持在任意硬件平台上编译以及 Python 3 import 功能。当构建环境与运行环境兼容时(具体为 cpython、glibc、glibcxx 和 cxxabi 版本匹配或兼容),可进行交叉编译,编译产物可在对应芯片部署的平台上跨平台运行。
CI/CD 集成
项目为 iluvatar、xpu、mthreads、nvidia 等后端实现了全面的 CI/CD 流水线,实现从编译到正确性测试的端到端验证。
质量管理框架
除了覆盖多个后端芯片的 CI/CD 之外,FlagTree 还实现了质量和合规保障机制,包括贡献者许可协议(CLA)签署和安全合规扫描。
已知问题#
目前不支持 triton-opt、proton 及相关工具。
展望#
FlagTree 将继续投入 Triton 生态,重点跟踪 Triton 版本更新、集成 AI 芯片后端、提升编译效率以及增强跨平台兼容性。此外,FlagTree 将探索在通用可用性与芯片特定优化需求之间取得平衡,为硬件存储层级、并行层级和加速单元提供兼容的语言级统一抽象和显式规范。