Skip to main content

Ctrl+K

Quark Version List

GitHub
Support

Quark 0.7 documentation

Release Notes

Release Information

Getting Started with Quark

Introduction to Quantization
Installation
Basic Usage
- Quark for PyTorch
- Quark for ONNX
Accessing PyTorch Examples
Accessing ONNX Examples

Advanced Quark Features for PyTorch

Configuring PyTorch Quantization
Save & Load Quantized Models
Exporting Quantized Models
Best Practices for Post-Training Quantization (PTQ)
Debugging quantization degradation
Language Model Optimization
Activation/Weight Smoothing (SmoothQuant)
Block Floating Point 16
Extensions
- Integration with AMD Pytorch-light (APL)
- Brevitas Integration
Using MX (Microscaling)
Two Level Quantization Formats

Advanced Quark Features for ONNX

Configuring ONNX Quantization
Data and OP Types
Accelerate with GPUs
Mixed Precision
Block Floating Point 16 (BFP16)
BF16 Quantization
Microscaling (MX)
Accuracy Improvement Algorithms
Optional Utilities
Tools

APIs

PyTorch APIs
ONNX APIs

Troubleshooting and Support

PyTorch FAQ
ONNX FAQ

Language Model Optimization

Language Model Optimization

Language Model Optimization#

Pruning
Language Model Post Training Quantization (PTQ) Using Quark
Language Model QAT Using Quark
Language Model Evaluations in Quark
Quantizing with Rotation and SmoothQuant

previous

Debugging quantization degradation in Quark

next

Quantizing with Rotation and SmoothQuant

Last updated on Jul 12, 2025.

Terms and Conditions
Quark Licenses and Disclaimers
Privacy
Trademarks
Statement on Forced Labor
Fair and Open Competition
UK Tax Strategy
Cookie Policy
Cookie Settings

© 2024 Advanced Micro Devices, Inc