Embedding 版本治理:向量不是生成完就一劳永逸 Embedding 版本治理向量不是生成完就一劳永逸RAG 系统上线后很多团队会忽略 Embedding 版本治理。文档切片向量化之后好像就进了知识库可以一直用了。但模型升级、切片策略调整、清洗规则变化、语言版本变化都会影响向量空间。新旧向量混在一起召回质量会悄悄下降。Embedding 不是一次性产物而是需要版本管理的数据资产。一、向量版本要和文档版本分开flowchart TD A[Raw Document] -- B[Chunking v1] A -- C[Chunking v2] B -- D[Embedding Model A] C -- E[Embedding Model B] D -- F[Vector Index v1] E -- G[Vector Index v2]同一份文档可以有不同切片版本和不同 Embedding 版本。文档没变不代表向量没变。治理时要把这些维度拆开。版本管理还要考虑兼容性。当切换 Embedding 模型时新旧向量可能不在同一个空间不能直接混合召回。一种策略是双写双读旧索引继续服务同时构建新索引逐步切流量另一种策略是向量迁移把旧向量用新模型重新生成但这要求原始文本仍然可访问。选择哪种取决于系统规模和切换风险。version_policy: allow_mixed_versions: false transition_strategy: dual_index consistency_check: true二、元数据必须记录完整每个向量条目至少要记录文档版本、切片策略、Embedding 模型、维度、归一化方式和生成时间。{ chunk_id: doc_88_012, doc_version: 2026-07-03, chunker_version: recursive-v2, embedding_model: embed-large-3, dimension: 3072, normalized: true, created_at: 2026-07-03T10:00:00Z }没有元数据后面排查召回异常会非常痛苦。你甚至不知道某条向量是怎么来的。元数据还要支持查询和过滤。当需要重建某个版本的向量、下线某个模型产生的向量、或审计某个时间段的向量质量时必须能通过元数据快速定位。这意味着元数据不仅要存还要能高效检索。可以把关键元数据字段同步到向量数据库的元数据索引中或者在外部数据库维护向量注册表支持按版本、模型、时间范围批量操作。三、升级要双索引灰度Embedding 模型升级不要直接覆盖旧索引。更稳的方式是构建新索引做离线评估再灰度查询流量。embedding_rollout: old_index: kb_v1 new_index: kb_v2 offline_eval_required: true shadow_query_percent: 20 production_traffic_percent: 5灰度期间对比召回命中率、答案引用质量、无结果率和用户反馈。确认收益后再逐步切流。离线评估集也要版本化。每次 Embedding 升级前用同一批问题、标准答案和期望引用文档跑一遍避免“感觉新模型更好”。如果新索引在核心问题上召回变差就算平均分更高也不应该直接切生产。四、删除和回滚也要设计知识库会删除文档、撤销权限、更新内容。向量索引必须支持按 doc_id、chunk_id、version 删除不能只会追加。CREATE TABLE embedding_registry ( index_name VARCHAR(64), doc_id VARCHAR(64), chunk_id VARCHAR(64), embedding_version VARCHAR(64), active BOOLEAN, updated_at TIMESTAMP );注册表能帮助后端知道哪些向量有效哪些需要重建哪些属于旧版本可回滚集合。向量数据的一致性也要关注。当文档更新时要确保旧向量被删除、新向量已生成、且这个过程是原子的。如果删除成功但生成失败会出现知识缺口如果生成成功但删除失败会出现重复或冲突的向量。可以通过事务消息、状态机或补偿任务来保证最终一致性。对于关键知识库建议在更新前后做快照便于快速回滚。在成本维度上Embedding 模型的选择也直接影响系统总开销。以 100 万份文档、平均 500 Token/切片计算使用 embed-large-33072 维单次索引的向量存储约需 12GB而使用 embed-small1536 维仅需 6GB。如果按月重建索引年度存储和计算成本差异可达数万美元。我们建议对高价值、高查询频率的内容使用大维度模型对冷数据、低频查询使用小维度模型在召回质量和成本之间做分层治理。五、总结Embedding 版本治理要把文档版本、切片策略、模型版本、索引版本和权限状态都记录清楚。升级时用双索引灰度删除和回滚也要有注册表支撑。向量不是生成完就一劳永逸。它和代码、配置、数据库 schema 一样需要版本、评估和发布流程。当知识库开始服务真实业务后Embedding 治理就不是算法细节而是后端数据治理的一部分。