API受限下15种LLM幻觉抑制创新方法

LLM 幻觉抑制:API 调用场景下的创新方法

目录

  • LLM 幻觉抑制:API 调用场景下的创新方法
    • 一、解码与采样层创新(API 可控参数)
      • 1. Self-Consistency(自一致性投票)
      • 2. Chain-of-Verification (CoVe, Meta 2023)
      • 3. DoLa / Contrastive Decoding(对比解码)
      • 4. Constrained / Grammar-Guided Decoding
    • 二、输入与上下文层创新
      • 5. RAG + 强约束 Prompt("封闭式回答")
      • 6. 引用前置 / Attribution-First Prompting
      • 7. Knowledge Boundary Probing(不确定性引导)
    • 三、输出验证层创新
      • 8. SelfCheckGPT(无参考一致性检测)
      • 9. LLM-as-a-Judge / Verifier Chain
      • 10. Atomic Fact Decomposition(原子化事实分解)
      • 11. Reflexion / Self-Refine 闭环
    • 四、系统级与新兴方向
      • 12. Speculative RAG / 双模型路由
      • 13. 工具调用化幻觉抑制(Tool-Augmented)
      • 14. Uncertainty-aware Decoding via Logprobs
      • 15. Retrieval-Augmented Generation with Citations (RAG-CoT) + Citation Verification
    • 五、组合落地建议(工程实践)

在仅能通过 API 调用 LLM(无法微调模型权重)的约束下,抑制幻觉的创新点主要集中在输入侧(Prompt/Context 工程)解码侧(采样/打分策略)输出侧(验证与修正)三个层面。


一、解码与采样层创新(API 可控参数)

1. Self-Consistency(自一致性投票)

做法:同一 prompt 用temperature>0采样 N 条答案,对最终答案做"多数投票"或"语义聚类"。

核心原理

  • 幻觉是"概率分布尾部"的随机事件,正确答案才是"高概率众数"。
  • 对 N 条独立采样路径,正确答案在多次采样中重复出现的概率远高于错误答案——用蒙特卡洛的"多数稳定性"过滤随机性幻觉

API 层实现:调用 N 次completions(或一次n=N),再做投票/聚类。


2. Chain-of-Verification (CoVe, Meta 2023)

做法:先生成