大模型推理加速技术综述:量化、剪枝与蒸馏 阅读:1905发布:2026-06-10 10:00:00 随着大模型参数规模不断增长,推理加速成为 AI 工程化的核心挑战。本文系统介绍量化、剪枝、知识蒸馏等主流优化技术。