📊 监控
在用户发现问题之前,先知道哪里坏了。
OPL 数据空间提供健康检查和模型接口,足够让你很容易接上可用性监控、模型连通性检查以及端到端响应验证。无论你是单实例还是多节点部署,这些检查都能帮你确认服务在线、模型可达、推理真实可用。
为什么要监控?
更快发现故障
如果每 60 秒做一次健康检查,你最多一分钟就能知道服务不可用,而不是等用户来报错。
验证模型侧连通性
OPL 数据空间进程存活,不代表上游模型服务也正常。检查 /api/models 可以及时发现“前端活着、模型挂了”的空档。
端到端确认
最深的一层检查会发出真实 prompt 并校验返回值。只要这一层通过,就能说明 API、后端、模型提供方和推理链路整体都在工作。