quantizing-models-bitsandbytes

Installation

SKILL.md

bitsandbytes - LLM Quantization

bitsandbytes reduces LLM memory by 50% (8-bit) or 75% (4-bit) with <1% accuracy loss.

Installation:

pip install bitsandbytes transformers accelerate

8-bit quantization (50% memory reduction):

from transformers import AutoModelForCausalLM, BitsAndBytesConfig

Installs

344

Repository

GitHub Stars

30.0K

First Seen

Jan 21, 2026

Security Audits

quantizing-models-bitsandbytes — davila7/claude-code-templates