本文分类:news发布日期:2026/6/30 3:23:07
打赏

相关文章

实战篇第7节:训练后量化PTQ——原理与TensorRT实现

模型训好了,FP32权重8GB,部署时显存不够——训练后量化(PTQ)是"不重新训练就把模型压到1/4"的核心技术。但量化不只是scale和zero_point,关键是"在哪量化"和"怎么校准" 前言 训练后量化(Post-Training Quantization, PTQ)是模型部署的&q…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部