FlagFFT 发布说明

目录

FlagFFT 发布说明#

v0.1.0#

FlagFFT 首次发布。

  • 新增功能

    • 实验性 C++ FFT 库,提供与 cuFFT 风格兼容的 C API。

    • 基于 Triton/TLE 生成的 CUDA 内核,在计划创建时进行 JIT 编译。

    • 一维复数到复数 —— C2C、Z2Z(complex64 和 complex128)。

    • 一维实数到复数 —— R2C、D2Z(float 和 double)。

    • 一维复数到实数 —— C2R、Z2D(float 和 double)。

    • 一维往返 —— R2C+C2R、D2Z+Z2D 往返变换。

    • 二维 FFT —— C2C、Z2Z、R2C、D2Z、C2R、Z2D 二维变换。

    • 任意长度连续一维批量变换。

    • 融合四步路径支持超大复合长度。

    • Bluestein 回退支持任意一维复数长度。

    • 原生 CLI(flagfft-cli)用于基准测试测量和计划检查。

    • 使用 Google Test 和 cuFFT 参考比较的 C++ 测试套件。

    • 基于 pytest 的 Python 基准测试套件,支持性能测量。

    • 统一测试运行器(tools/run_tests.py),支持精度和性能报告。

    • 计划描述 API(flagfftGetPlanDescription)用于性能调试。

    • 预构建依赖的 Docker 开发环境。

    • 算子注册表(conf/operators.yaml),包含完整的算子元数据。