LLM 技术量化:减小模型大小 (zh)On this page量化:减小模型大小 (zh) 训练后量化 (PTQ, Post-training quantization) 对训练结束后的最终模型进行量化。 感知量化 (QAT, Quantization-aware training) 对预训练模型做量化。