📚 知识库

把你的文档交给 AI，让它真正找到有用的信息。

知识库是你存放文件和知识集合的地方，AI 可以在这里搜索、阅读并基于这些内容推理。你可以上传 PDF、表格、代码或任意文本类文档，再按项目、团队或主题把它们组织成集合。当模型需要回答问题时，它不必猜，而是先从知识库中检索。

和笔记不同，知识库默认依赖检索（RAG）按需找到相关片段，而不是把全文每次都注入上下文。这使它更适合大规模文档集。

组织感知知识库

在多组织部署里，知识库、文件和检索结果都应被视作租户级资源，除非你明确做了更大范围共享。如果迁移或租户拆分后文档“消失了”，先检查归属权同步，而不要第一时间怀疑检索质量。

为什么需要知识库

让文档变成 AI 可检索知识

上传合同、技术规格、研究报告后，AI 可以按语义而不是只按关键词搜索，并指出答案来自哪里。

两种检索模式覆盖不同需求

你可以用 Focused Retrieval 处理大规模文档集，也可以用 Full Context 在精确性优先时把整份文档逐字注入。

原生函数调用下的自主探索

启用 native function calling 后，模型不只是在搜索，它还能自主浏览知识库、分页读取文件，并跨多个文档综合信息。

作用域清晰、便于管理

你可以把某些知识库绑定到模型上，让它只搜索相关资料；也可以保持不绑定，让模型在用户有权限访问的范围内自行发现全部可用知识。

关键能力


📄 9 种向量数据库	官方维护 ChromaDB 与 PGVector，也支持 Qdrant、Milvus、OpenSearch、Elasticsearch 等社区方案
🔍 混合搜索	BM25 关键词检索 + 向量检索 + cross-encoder rerank
📑 5 种抽取引擎	Tika、Docling、Azure、Mistral OCR、自定义 loader
🤖 Agentic 检索	模型可以自主浏览、搜索和阅读文档
📄 Full Context 模式	不切块，直接注入完整文档
📦 导出与 API	知识库可导出 zip，也可以通过 REST API 管理

检索模式

给模型附加文件或知识库时，点击附件本身即可在两种模式间切换：

🔍 Focused Retrieval（默认）

通过 RAG 找到与当前问题最相关的片段，然后注入给模型。若启用了 ENABLE_RAG_HYBRID_SEARCH，则会结合 BM25、向量检索和重排。

适合大规模文档集，只需要命中其中部分内容的场景。

📄 Full Context

把文件完整内容注入每条消息，不做切块也不做语义检索。即便启用了 native function calling，也会始终直接注入。

适合短参考文档、风格指南或每次都必定相关的上下文。

Agentic 知识库工具

启用 native function calling 后，模型会通过内置工具与知识库交互。具体出现哪些工具，取决于模型是否绑定了特定知识库：

工具	已绑定 KB	未绑定 KB	说明
`list_knowledge`	✅	❌	列出当前模型绑定的全部 KB、文件和笔记
`list_knowledge_bases`	❌	✅	浏览全部可访问知识库及其文件数
`search_knowledge_bases`	❌	✅	按名称或描述搜索知识库
`query_knowledge_bases`	❌	✅	通过语义相似度搜索知识库名称与描述
`search_knowledge_files`	✅（限定）	✅（全部）	按文件名搜索文件
`query_knowledge_files`	✅（限定）	✅	通过 RAG 搜索文件内容
`view_file`	✅	❌	分页读取文件内容
`view_knowledge_file`	✅	✅	从任意可访问 KB 中读取文件
`view_note`	✅	❌	读取附加的笔记

核心区别在于：

绑定 KB 后，模型只会围绕这些文档工作
不绑定 KB 后，模型可以发现用户当前有权限访问的全部知识

native function calling 下不会自动注入知识库

启用 native function calling 后，绑定的知识库 不会自动被注入。模型必须主动调用相关工具去搜索和读取。

如果你发现模型没有正确使用知识库：

在 system prompt 中明确告诉模型要用 list_knowledge 和 query_knowledge_files
为该模型关闭 native function calling，恢复自动注入
对附件切换成 Full Context 模式，绕过 RAG

如何建立知识库

在侧边栏进入 工作区 > 知识库
点击 + New Knowledge
上传文件，或添加已有文档
在 工作区 > 模型 > 编辑 中把它绑定到某个模型，或者在聊天里通过 # 引用

导出

管理员可以通过项目菜单里的 Export 把整个知识库导出为 zip。文件会被转成 .txt，方便通用兼容。普通用户看不到这个选项。

API 管理

知识库也可以通过 API 管理：

POST /api/v1/files/：上传文件
GET /api/v1/files/{id}/process/status：查看处理状态
POST /api/v1/knowledge/{id}/file/add：把文件加进知识库

文件处理是异步的，必须等处理完成后再把文件加进 KB，否则会遇到 “empty content” 一类问题。

典型场景

项目文档助手

把团队技术规范、架构文档和 runbook 放进一个知识库，并绑定到 “Project Assistant” 模型上，让 AI 回答时基于真实内部文档而不是通用训练数据。

法务与合规审查

加载合同、政策和监管材料，让 AI 帮你定位条款、对比不同协议或发现不一致点。

研究综述

向知识库中加入大量论文，让 AI 跨多篇文献搜索答案、汇总证据，或指出研究结论之间的冲突。

限制

Full Context 可能挤爆上下文窗口

如果文档很大，而模型上下文窗口较小，那么整份文档注入会直接挤压正常聊天历史。

通过 API 上传存在处理延迟

通过 API 上传的文件是异步处理的，过早使用时可能返回空结果或静默失败。

native function calling 会改变知识库行为

一旦启用了 native function calling，知识库的工作方式会显著变化。如果知识库突然不再生效，请先检查模型默认值里是否把 function_calling: native 打开了。

为什么需要知识库​

让文档变成 AI 可检索知识​

两种检索模式覆盖不同需求​

原生函数调用下的自主探索​

作用域清晰、便于管理​

关键能力​

检索模式​

🔍 Focused Retrieval（默认）​

📄 Full Context​

Agentic 知识库工具​

如何建立知识库​

导出​

API 管理​

典型场景​

项目文档助手​

法务与合规审查​

研究综述​

限制​

Full Context 可能挤爆上下文窗口​

通过 API 上传存在处理延迟​

native function calling 会改变知识库行为​