Skip to main content

Ctrl+K

Quark Version List

GitHub
Support

AMD Quark 0.12.post1 documentation

Release Notes

Release Information

Getting Started with AMD Quark

Introduction to Quantization
Installation
Getting started: Introduction
Getting started: Quark for PyTorch
Getting started: Quark for ONNX
PyTorch Tutorials
PyTorch Examples
ONNX Tutorials

Supported accelerators

AMD Ryzen AI
AMD Instinct

Advanced AMD Quark Features for PyTorch

Configuring PyTorch Quantization for Large Language Models
Configuring PyTorch Quantization from Scratch
Save and Load Quantized Models
Exporting Quantized Models
Best Practices for Post-Training Quantization (PTQ)
Debugging quantization Degradation
File-to-File LLM Quantization
Language Model Optimization
Activation/Weight Smoothing (SmoothQuant)
Auto SmoothQuant
Activation-aware Weight Quantization (AWQ)
- AWQ end-to-end demo
SVD-Based Error Correction (SVDQuant)
Block Floating Point 16
Extensions
- Integration with AMD Pytorch-light (APL)
- Brevitas Integration
Using MX (Microscaling)
Two Level Quantization Formats
Using Quark Agent Skills (Claude Code)

Advanced Quark Features for ONNX

Configuring ONNX Quantization
Data and Op Types
Accuracy Improvement
Efficiency Improvement
Tooling
Using Quark Agent Skills (Claude Code)

Third-party contributions

Introduction and guidelines

Experimental Features

Quark CLI
- Shapeshifter
  - ONNX Model Passes
  - PyTorch Model Passes
Mix Precision Auto-Search
Blockwise Joint Tuning
Built-in Profiling
ONNX Examples

APIs

PyTorch APIs
ONNX APIs
- Quantization
- Quantizer Configuration

Troubleshooting and Support

PyTorch Troubleshooting
ONNX Troubleshooting

AMD Quark release history
Quark license

Quark for ONNX Tutorials
LLM Tutorials

LLM Tutorials

LLM Tutorials#

GPTQ

Apply GPTQ (Generative Pre-trained Transformer Quantization) to compress large language models with minimal accuracy loss.

Quark ONNX Quantization Tutorial For GPTQ

previous

Quark ONNX Quantization Tutorial For Image Classification

next

Quark ONNX Quantization Tutorial For GPTQ

Last updated on Jul 10, 2026.

Terms and Conditions
Quark Licenses and Disclaimers
Privacy
Trademarks
Supply Chain Transparency
Fair and Open Competition
UK Tax Strategy
Cookie Policy
Cookie Settings

© 2025 Advanced Micro Devices, Inc