FlagSparse 发布说明

目录

FlagSparse 发布说明#

v0.2.0#

  • 新增功能

    • SpMM 算子 —— SpMM COO、SpMM CSR-opt、SpMM CSR-opt-alg2、AlphaSparse SpMM alg1(含 TLE 和 TLE-opt 变体)。

      • 在 NVIDIA 上支持。

    • SpGEMM 算子 —— CSR 输入的稀疏矩阵-稀疏矩阵乘法。

      • 在 NVIDIA 上支持。

    • SDDMM 算子 —— 基于 CSR 稀疏模式的采样稠密-稠密矩阵乘法。

      • 在 NVIDIA 上支持。

    • SpSM 算子 —— 带稠密矩阵右侧的稀疏三角求解(CSR 和 COO)。

      • 在 NVIDIA 上支持。

    • SpSV 描述符 API —— 完整的描述符、缓冲区大小、分析、预处理和求解 API,用于 SpSV 工作流。

      • 在 NVIDIA 上支持。

    • 稀疏格式构造函数 —— create_csr_matrix、create_coo_matrix、create_csc_matrix、create_bsr_matrix、create_sell_matrix、create_blocked_ell_matrix、coo_to_csr、coo_to_csc、coo_to_bsr、coo_to_sell、coo_to_blocked_ell、generate_random_sparse_matrix、read_mtx_file。

      • 在 NVIDIA 上支持。

    • 算子注册表 —— 添加了 conf/operators.yaml,包含完整的算子元数据。

      • 在 NVIDIA 上支持。

    • CI/CD 流水线 —— GPU CI 工作流、每夜 CPU 检查、发布草稿器、pre-commit 配置。

      • 在 NVIDIA 上支持。

  • 增强功能

    • SpMV CSR 和 COO 算子经过显著优化和精度改进。

    • SpSV CSR 和 COO 求解器扩展了全面的测试覆盖和基于描述符的 API。

    • Gather/Scatter 算子增强了 int64 支持。

    • 基准测试框架统一,具有标准化的形状配置。

    • pytest 精度套件扩展,为所有算子添加了专用测试文件。

v0.1.0#

FlagSparse 首次发布。

  • 新增功能

    • GPU 稀疏运算包,包含 SpMV、SpMM、SpGEMM、SDDMM、gather 和 scatter 算子。

    • CSR 和 COO 稀疏格式支持。

    • SpSV 和 SpSM 三角求解算子。

    • FlagGems 风格的算子接口注册表(conf/operators.yaml)。

    • 基于 CPU-FP64 金标准参考比较的 pytest 精度套件。

    • 具有两级加速比报告的性能基准测试框架。