FlagTree 0.5.0 发布

FlagTree 0.5.0 发布#

  • 新增特性

    • 正式发布 TLE 特性,支持 TLE-Lite 和 TLE-Struct 共 31 个核心原语:

      • TLE-Lite:

        • NVIDIA:tle.load(is_async=True)tle.extract_tiletle.insert_tiletle.device_meshtle.shardingtle.distributed_barriertle.remotetl.load(用于 local_ptr),tl.store(用于 local_ptr),tl.atomic_add/and/cas/max/min/or/xchg/xor(用于 local_ptr)。

        • Tsingmicro:tle.device_meshtle.shardingtle.remote,以及 tl.store(用于 local_ptr)。

      • TLE-Struct:

        • NVIDIA:tle.gpu.memory_spacetle.gpu.alloctle.gpu.copytle.gpu.local_ptr,以及 tle.gpu.local_ptr(用于 remote)。

        • 华为昇腾:tle.dsa.alloctle.dsa.copytle.dsa.local_ptrtle.dsa.local_ptr(用于 remote),tle.dsa.to_tensortle.dsa.to_buffertle.add/sub/mul/div/max/mintle.dsa.pipelinetle.dsa.paralleltle.dsa.hinttle.dsa.extract_slicetle.dsa.insert_slicetle.dsa.extract_elementtle.dsa.subviewtle.dsa.ascend.{UB,L1,L0A,L0B,L0C}

        • Tsingmicro:tle.dsa.alloctle.dsa.local_ptr,以及 tle.dsa.local_ptr(用于 remote)。

    • 正式发布 FLIR(FlagTree 中间表示)特性。

      • 支持 76 个 Triton 语言原语和 103 个算子。

      • 启用跨后端共享编译器 pass

      • 支持的硬件平台:AIPU、华为昇腾和 Tsingmicro