关闭 prompt caching 不是优化手段，而是一把调试用的手术刀-拓冰建站

我今天在看 Claude Code 的缓存策略时，最容易被误用的一组参数，恰好不是开启缓存的参数，而是关闭缓存的参数。因为很多性能问题看起来都像缓存问题，模型忽快忽慢，/cost里的 token 数字忽高忽低，切到 Bedrock、Vertex、Foundry 或内部网关之后，缓存命中又变得不稳定。这个时候，我们很容易下意识地想把缓存关掉，觉得这样结果更干净。但在 Claude Code 的真实工作流里，关闭 prompt caching 更像是调试用的隔离开关，而不是日常开发里的性能优化按钮。

Claude Code 官方环境变量文档明确列出了一组开关，DISABLE_PROMPT_CACHING可以对所有模型关闭 prompt caching，而DISABLE_PROMPT_CACHING_HAIKU、DISABLE_PROMPT_CACHING_SONNET、DISABLE_PROMPT_CACHING_OPUS、DISABLE_PROMPT_CACHING_FABLE则分别只影响对应模型系列。官方文档还写得很清楚，DISABLE_PROMPT_CACHING的优先级高于这些按模型粒度设置的变量。也就是说，一旦全局开关被设为1，再单独讨论 Sonnet、Haiku、Opus 或 Fable 是否缓存，就没有意义了。(

关闭 prompt caching 不是优化手段，而是一把调试用的手术刀

相关新闻

HCI 功能规范【3. Overview of commands and events】

【会议征稿通知 | 曲靖师范学院主办 | IEEE出版 | EI 、Scopus稳定检索】2026年计算机科学、机器学习与智能体国际学术会议（CSMLA 2026）

B10：AI 时代怎么向下管理？我用 4 个机制让团队自动跑起来

最新新闻

Flutter游戏物理引擎：碰撞检测与游戏逻辑实现

免费B站会员购抢票神器：告别手速焦虑的终极解决方案

矩估计法实战：用样本矩估计总体参数的2个经典案例与Python实现

从零开始：为Flipper Zero编译自定义本田固件的完整指南

中国上市高新技术企业管理成熟度白皮书（框架）

LiveViewJS JavaScript命令大全：15个实用命令提升用户体验

日新闻

本地部署SAM Audio音频语义分割模型完整指南

Zip炸弹漏洞剖析：从GuardDog安全工具瘫痪看文件解压的资源耗尽攻击与防御

Playwright自动化测试实战：从零搭建现代Web测试框架

周新闻

Figma中文界面插件终极指南：5分钟快速上手完整教程

Windows字体自定义终极方案：No!! MeiryoUI完全指南

WinBtrfs终极实战指南：3种配置方案解锁Windows Btrfs文件系统完整功能

月新闻

[C++]内存管理：串顺序存储的内存回收

移动端游戏功耗测试实战：电流、功率、亮度和场景对比

足球口袋教练 HarmonyOS 离线应用实战（03/20）：ArkUI 首页仪表盘搭建