FlagTree 0.1.0 发布

FlagTree 0.1.0 发布#

亮点#

FlagTree 初始版本基于 Triton 3.1 构建,引入对多种 AI 芯片后端的支持。在早期阶段,项目旨在保持与现有后端适配方案的兼容性,同时统一代码库,实现快速的单版本多后端支持。

新特性#

  • 多后端支持

    目前支持的后端包括 iluvatar、xpu (klx)、mthreads 和 cambricon。

  • 双编译路径支持

    在此初始阶段,项目为 TritonGPU 方言和 Linalg 方言编译路径提供基本兼容性。

  • 可插拔高差异模块架构

    通过插件架构实现芯片特定的后端定制。这些非通用模块由各芯片厂商维护,并通过工程实践与 FlagTree 主仓库保持结构一致性。

  • 交叉编译与快速验证能力

    为方便开发者,FlagTree 支持在任意硬件平台上编译以及 Python 3 import 功能。当构建环境与运行环境兼容时(具体为 cpython、glibc、glibcxx 和 cxxabi 版本匹配或兼容),可进行交叉编译,编译产物可在对应芯片部署的平台上跨平台运行。

  • CI/CD 集成

    项目为 iluvatar、xpu、mthreads、nvidia 等后端实现了全面的 CI/CD 流水线,实现从编译到正确性测试的端到端验证。

  • 质量管理框架

    除了覆盖多个后端芯片的 CI/CD 之外,FlagTree 还实现了质量和合规保障机制,包括贡献者许可协议(CLA)签署和安全合规扫描。

已知问题#

  • 目前不支持 triton-opt、proton 及相关工具。

展望#

FlagTree 将继续投入 Triton 生态,重点跟踪 Triton 版本更新、集成 AI 芯片后端、提升编译效率以及增强跨平台兼容性。此外,FlagTree 将探索在通用可用性与芯片特定优化需求之间取得平衡,为硬件存储层级、并行层级和加速单元提供兼容的语言级统一抽象和显式规范。