[Roadmap] Primus-Turbo Roadmap H2 2025

This roadmap is the H2 2025 development plan of Primus-Turbo.

**Note:** The roadmap is flexible and will be updated over time based on project needs and community input.

# Release Overview
| Version     | Framework                         | Status                  | Date                           |
|------------|------------------------------|--------------------|------------------------|
| **v0.1.0** | PyTorch + ROCm6.4           | ✅ Released        | 2025-09-11               |
| **v0.1.1** | PyTorch + ROCm7.0           | ✅ Released        | 2025-10-15               |
| **v0.2.0** | PyTorch + ROCm7.1           | ✅ Released        | 2025-12-05               |


# Detailed Plans
## v0.1.0 (Released)
### Focus
- Build the foundational framework of Primus-Turbo.
- Provide core operators.
### Features
- [x]  GEMM: Support FP16/BF16.
- [x]  FlashAttention:  Support FP16/BF16.
- [x]  GroupedGEMM: Support FP16/BF16. 
### Famework
- [x] Provide PyTorch APIs
- [x] Support ROCm 6.4 

## v0.2.0 (Released)
### Focus
- Introduce FP8 foundational support.
- Enable communication primitives with FP8, focusing on DeepEP.

### Features
- [x] GEMM: Support FP8 (E4M3/E5M2).
  - [x] Support Tensorwise.
  - [x] Support Rowwise.
  - [x] Support Blockwise.
  - [x] Support MX
- [x] FlashAttention: Support FP8 (E4M3/E5M2).
  - [x] Support Blockwise. 
- [ ] GroupedGEMM: Support FP8 (E4M3/E5M2).
  - [x] Support Tensorwise.
  - [x] Support Rowwise.
  - [x] Support Blockwise.
  - [ ] Support MX
- [x] All2All: FP8 support.
  - [x] Support Tensorwise.
- [ ] DeepEP:
  - [x] Intra-Node Normal Kernel.
  - [x] Inter-Node Normal Kernel.
  - [x] Support NICs.
      - [x] ConnectX-7 
      - [x] Thor2
      - [x] Pensando
  - [x] Support `internode_dispatch` GPU-CPU no sync.
  - [ ] Support `torch.compile`
- [x] TokenDispatcher:
    - [x] Integrate Permute/Unpermute
    - [x] Support Sync-Free `DeepEPTokenDispatcher`
    - [x] Support MoE Fused Activations.


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Roadmap] Primus-Turbo Roadmap H2 2025 #101

Release Overview

Detailed Plans

v0.1.0 (Released)

Focus

Features

Famework

v0.2.0 (Released)

Focus

Features

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Version	Framework	Status	Date
v0.1.0	PyTorch + ROCm6.4	✅ Released	2025-09-11
v0.1.1	PyTorch + ROCm7.0	✅ Released	2025-10-15
v0.2.0	PyTorch + ROCm7.1	✅ Released	2025-12-05

[Roadmap] Primus-Turbo Roadmap H2 2025 #101

Description

Release Overview

Detailed Plans

v0.1.0 (Released)

Focus

Features

Famework

v0.2.0 (Released)

Focus

Features

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions