Agentic Web Search 与 URL 抓取 🌐
OPL 数据空间的网页搜索已经从“简单注入搜索结果”演进成了完整的 agentic research system。启用 Native Function Calling(Agentic Mode) 后,高质量模型可以自主搜索网页、验证事实、跟进链接,并基于过程中的发现不断调整下一步动作。
需要高质量模型
Agentic web search 最适合 GPT-5、Claude 4.5+、Gemini 3+、MiniMax M2.5 这类具备较强推理与工具使用能力的模型。较小的本地模型通 常难以稳定完成多步搜索推理。
中央工具文档
关于全部内建 agentic 工具,请参阅 Native/Agentic Mode Tools Guide。
Native Mode 与传统 RAG 的区别
| 特性 | 传统 RAG | Agentic Search(Native Mode) |
|---|---|---|
| 是否搜索 | 由 OPL 数据空间决定 | 由模型自己决定 |
| 数据处理 | 抓取所有结果,再 chunk / embedding | 先返回 snippets,不进向量库 |
| 跟进链接 | 只注入前几条结果的片段 | 可通过 fetch_url 阅读完整页面 |
| 模型拿到的上下文 | 只拿到 Top-K 片段 | 可通过 fetch_url 获得整页文本 |
| 推理方式 | 系统注入后再回答 | 可循环执行“搜、读、判断、再搜” |
如何启用 Agentic 行为
- 在 管理员面板 → 设置 → Web Search 中先配置好搜索引擎
- 在 管理员面板 → 设置 → Models 中为目标模型启用 Web Search capability
- 在同一模型设置中,将 Default Features 下的 Web Search 勾上
- 在 Advanced Parameters 中把 Function Calling 设为
Native - 尽量选用具备强推理能力的模型
Model Capability、Default Features 与聊天开关
在 Native Mode 下,search_web 与 fetch_url 需要同时满足:
- 模型启用了 Web Search capability
- 模型的 Default Features 里启用了 Web Search,或聊天中手动打开
少了任意一个,工具都不会被注入。
Native Tools 如 何处理数据
search_web:只返回 Snippets
当模型调用 search_web 时:
- 系统会查询你配置的搜索引擎
- 返回标题、链接和 snippets
- 不会进入 Vector DB,不做 chunking,也不做 embedding
- 如果 snippet 足够回答问题,模型就直接作答;否则模型会自行决定是否继续深入
fetch_url:读取完整页面
如果 snippet 不够,模型就会调用 fetch_url:
- 工具会直接访问指定 URL
- 使用当前配置的 Web Loader 抽取正文
- 抽取出的内容会直接注入到模型上下文
- 当前会对正文做长度截断,以避免上下文溢出
提示
search_web 与 fetch_url 被设计成分离的、非 RAG 化工具,因此模型更像是一个真正的信息检索 agent,会自己判断哪些来源值得深入阅读。
Deep Research 与 Interleaved Thinking 🧠
因为模型可以反复调用 search_web,并自主决定何时使用 fetch_url 深挖,所以它可以执行真正意义上的 “Deep Research”。
基本研究循环
- THINK:分析当前还缺哪些信息
- ACT:发起搜索或抓取具体 URL
- EVALUATE:判断拿到的信息够不够
- DECIDE:决定是否继续搜索、是否换关键词、是否读取其他链接
- ITERATE:重复上述过程
- SYNTHESIZE:在信息足够后给出最终答案
这种 Thought → Action → Thought 的循环,使模型不再只是“看一眼搜索结果就回答”,而是真正具备多轮研究行为。
Agentic Search 的优势
- 自适应精度:模型会根据结果不断收窄关键词、版本号、技术术语
- 深链路跟进:如果某页面里又引用了更重要的规范、论文或 changelog,模型可以继续跟过去读
- 多源交叉验证:模型可从多个来源验证同一结论,降低幻觉
- 自动补缺口:如果第一次搜索没找到关键答案,模型会自动换角度再搜
- 多源综合:最终答案往往来自多个页面的整合,而不是单一片段
更多关于 Interleaved Thinking
如需了解这类“交替思考与行动”在其他 agentic 工具中的使用方式,请参阅 Interleaved Thinking Guide。
下一步
- 把搜索结果存进知识库:参阅 save-to-knowledge
- 排障:参阅 Web Search Troubleshooting Guide