大模型推理加速技术综述:量化、剪枝与蒸馏

系统介绍大模型推理阶段的优化技术,对比 INT8/INT4 量化、模型剪枝、知识蒸馏等方案的优劣与适用场景。

2026-06-101906 阅读