Quark GPT-OSS support #1903

thpereir · 2025-12-03T18:46:44Z

Add Quark GPT-OSS support

General support for QMoE zero point/asymmetric quantization
New layers used by Quark quantized models
Packing used for gate_up proj and down_proj inside Experts

src/python/py/models/builders/gptoss.py

-        gate_up_proj_transposed = mlp.experts.gate_up_proj.transpose(-1, -2)
-        down_proj_transposed = mlp.experts.down_proj.transpose(-1, -2)
+        if has_quark_experts:
+            gate_up_proj_transposed = torch.empty(0)


src/python/py/models/builders/gptoss.py

-        down_proj_transposed = mlp.experts.down_proj.transpose(-1, -2)
+        if has_quark_experts:
+            gate_up_proj_transposed = torch.empty(0)
+            down_proj_transposed = torch.empty(0)


- General support for QMoE zero point/asymmetric quantization - New layers used by Quark quantized models - Packing used for gate_up proj and down_proj inside Experts

thpereir · 2025-12-09T21:45:29Z

@microsoft-github-policy-service agree company="

@microsoft-github-policy-service agree company="AMD"

github-advanced-security bot found potential problems Dec 3, 2025

View reviewed changes

thpereir force-pushed the main branch from 8e7b23f to 4473756 Compare December 8, 2025 16:02

thpereir marked this pull request as ready for review December 9, 2025 17:36

thpereir force-pushed the main branch from 4473756 to 3b7c828 Compare December 9, 2025 18:16

Quark GPT-OSS support

b1e4a78

- General support for QMoE zero point/asymmetric quantization - New layers used by Quark quantized models - Packing used for gate_up proj and down_proj inside Experts

thpereir force-pushed the main branch from 3b7c828 to b1e4a78 Compare December 9, 2025 19:17

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Quark GPT-OSS support #1903

Quark GPT-OSS support #1903

thpereir commented Dec 3, 2025 •

edited

Loading

Uh oh!

Check notice

Check notice

thpereir commented Dec 9, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Quark GPT-OSS support #1903

Are you sure you want to change the base?

Quark GPT-OSS support #1903

Conversation

thpereir commented Dec 3, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Check notice

Check notice

thpereir commented Dec 9, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

thpereir commented Dec 3, 2025 •

edited

Loading