模型训练过程中会设置topkp和温度吗？-拓冰建站

top_k、top_p（核采样）和temperature（温度）都属于文本生成解码阶段的采样参数，两个阶段的情况如下：

大语言模型的常规训练（预训练、SFT）基于最大似然估计（MLE），采用教师强制（Teacher Forcing）模式，目标是让模型在给定上文时，最大化“正确下一个token”的预测概率：

训练时每一步的“标准答案”（下一个token）是已知的（来自训练语料）。
模型只需要输出所有token的概率分布，然后计算该分布与真实标签的交叉熵损失，再反向传播更新参数。
整个过程不需要执行“从概率分布里挑选一个token”的采样动作，而top_k、top_p、temperature恰恰只作用于这个采样环节，因此训练阶段无需设置。