跳到主要内容

Agentic Web Search 与 URL 抓取 🌐

OPL 数据空间的网页搜索已经从“简单注入搜索结果”演进成了完整的 agentic research system。启用 Native Function Calling(Agentic Mode) 后,高质量模型可以自主搜索网页、验证事实、跟进链接,并基于过程中的发现不断调整下一步动作。

需要高质量模型

Agentic web search 最适合 GPT-5、Claude 4.5+、Gemini 3+、MiniMax M2.5 这类具备较强推理与工具使用能力的模型。较小的本地模型通常难以稳定完成多步搜索推理。

中央工具文档

关于全部内建 agentic 工具,请参阅 Native/Agentic Mode Tools Guide

Native Mode 与传统 RAG 的区别

特性传统 RAGAgentic Search(Native Mode)
是否搜索由 OPL 数据空间决定模型自己决定
数据处理抓取所有结果,再 chunk / embedding先返回 snippets,不进向量库
跟进链接只注入前几条结果的片段可通过 fetch_url 阅读完整页面
模型拿到的上下文只拿到 Top-K 片段可通过 fetch_url 获得整页文本
推理方式系统注入后再回答可循环执行“搜、读、判断、再搜”

如何启用 Agentic 行为

  1. 管理员面板 → 设置 → Web Search 中先配置好搜索引擎
  2. 管理员面板 → 设置 → Models 中为目标模型启用 Web Search capability
  3. 在同一模型设置中,将 Default Features 下的 Web Search 勾上
  4. Advanced Parameters 中把 Function Calling 设为 Native
  5. 尽量选用具备强推理能力的模型
Model Capability、Default Features 与聊天开关

Native Mode 下,search_webfetch_url 需要同时满足:

  • 模型启用了 Web Search capability
  • 模型的 Default Features 里启用了 Web Search,或聊天中手动打开

少了任意一个,工具都不会被注入。

Native Tools 如何处理数据

search_web:只返回 Snippets

当模型调用 search_web 时:

  • 系统会查询你配置的搜索引擎
  • 返回标题、链接和 snippets
  • 不会进入 Vector DB,不做 chunking,也不做 embedding
  • 如果 snippet 足够回答问题,模型就直接作答;否则模型会自行决定是否继续深入

fetch_url:读取完整页面

如果 snippet 不够,模型就会调用 fetch_url

  • 工具会直接访问指定 URL
  • 使用当前配置的 Web Loader 抽取正文
  • 抽取出的内容会直接注入到模型上下文
  • 当前会对正文做长度截断,以避免上下文溢出
提示

search_webfetch_url 被设计成分离的、非 RAG 化工具,因此模型更像是一个真正的信息检索 agent,会自己判断哪些来源值得深入阅读。

Deep Research 与 Interleaved Thinking 🧠

因为模型可以反复调用 search_web,并自主决定何时使用 fetch_url 深挖,所以它可以执行真正意义上的 “Deep Research”。

基本研究循环

  1. THINK:分析当前还缺哪些信息
  2. ACT:发起搜索或抓取具体 URL
  3. EVALUATE:判断拿到的信息够不够
  4. DECIDE:决定是否继续搜索、是否换关键词、是否读取其他链接
  5. ITERATE:重复上述过程
  6. SYNTHESIZE:在信息足够后给出最终答案

这种 Thought → Action → Thought 的循环,使模型不再只是“看一眼搜索结果就回答”,而是真正具备多轮研究行为。

Agentic Search 的优势

  • 自适应精度:模型会根据结果不断收窄关键词、版本号、技术术语
  • 深链路跟进:如果某页面里又引用了更重要的规范、论文或 changelog,模型可以继续跟过去读
  • 多源交叉验证:模型可从多个来源验证同一结论,降低幻觉
  • 自动补缺口:如果第一次搜索没找到关键答案,模型会自动换角度再搜
  • 多源综合:最终答案往往来自多个页面的整合,而不是单一片段
更多关于 Interleaved Thinking

如需了解这类“交替思考与行动”在其他 agentic 工具中的使用方式,请参阅 Interleaved Thinking Guide

下一步