跳到主要内容

组织维护

如果你的 OPL 数据空间 部署启用了组织,那么维护工作不只是保证可用性,还包括在迁移、扩缩容和恢复系统时持续守住租户边界。


上线前需要复核什么

在启用或扩大组织化使用范围之前,请确认:

  1. 注册路由 已经配置了有效的落地组织
  2. 运维管理员 理解“选中的组织”和 Global 作用域之间的差异
  3. 文件存储向量检索 的部署模式适合多组织数据
  4. 恢复流程 已经覆盖失败迁移、待同步状态和失效资源

关键维护关注点

落地组织

新用户创建流程应始终能解析到一个有效的归属组织。

  • 从单工作区升级而来的实例,通常会先引导到一个默认组织
  • 每次配置或迁移变更后,都应重新检查注册与 SSO 流程
  • 如果落地组织缺失或被停用,系统应该明确失败,而不是创建损坏用户

可执行的检查项:

  1. 确认落地组织仍处于启用状态。
  2. 在调整组织默认值后,至少测试一次新注册或 SSO 下发。
  3. 在扩大上线范围前,先确认新账号是否落到了预期归属组织。

向量与检索维护

如果部署依赖 RAG,这一块需要格外谨慎:

  • 组织感知检索依赖正确的租户元数据
  • 维护上线时应避免继续提供陈旧或只迁移了一半的向量载荷
  • Qdrant 和其他外部向量后端,应该与整体扩缩容方案一起评估

另请参考:

如果本次变更对 RAG 很敏感,建议按下面顺序推进:

  1. 暂停租户迁移或大规模文档搬迁。
  2. 确认所有副本都能访问且向量后端处于健康状态。
  3. 完成向量存储所需的任何租户元数据迁移。
  4. 恢复流量前,再验证一次同组织查询和一次跨组织拒绝路径。

文件归属与修复

上传文件、生成产物以及派生出的知识资产,都应被视为带租户属性的运维数据。

如果你正在迁移存储布局,或者把用户移动到其他组织,请事先写清楚:

  • 迁移后如何验证文件仍可访问
  • 在你的环境里,“待修复”到底意味着什么
  • 谁负责处理失败的组织同步

需要修复时,建议这样处理:

  1. 先解决文件存储同步中的 pending 状态。
  2. 再解决向量归属同步中的 pending 状态。
  3. 之后重新测试受影响组织里的上传、知识检索和共享聊天附件。

不要把“用户能成功登录”误判为“租户迁移一定已经干净完成”。


运维检查清单

  • 在重大升级前确认组织结构
  • 在调整 provider 或功能策略前,重新确认全局与组织级设置的边界
  • 在多副本环境里谨慎执行维护上线
  • 为失败同步、损坏文件和 RAG 漂移保留清晰的恢复路径
  • 每次上线后都显式测试选中组织作用域下的管理页面
  • 对每个受影响租户至少验证一条用户路径和一条管理员路径

相关文档