跳到主要内容

Mistral OCR

注意

本教程为社区贡献内容,不属于 OPL 数据空间团队的官方支持范围。它主要演示如何按你的具体场景定制 OPL 数据空间。若想参与贡献,请查看贡献指南。

👁️ Mistral OCR

本文介绍如何把 Mistral OCR 集成到 OPL 数据空间。Mistral OCR 是一套光学字符识别能力,用于从扫描 PDF、图片、手写文档等图像型文件中提取文本,并输出 JSON 或纯文本等结构化内容。它在多语言识别、版面分析和手写理解方面表现较强。

前置条件

  • OPL 数据空间实例
  • Mistral AI 账户

集成步骤

第 1 步:注册或登录 Mistral AI 控制台

  • 访问 https://console.mistral.ai
  • 按页面提示完成注册或登录
  • 成功授权后进入 Console Home

第 2 步:生成 API Key

  • 打开 API Keys,或直接访问 https://console.mistral.ai/api-keys
  • 创建新的 key,并妥善复制保存

第 3 步:在 OPL 数据空间中启用 Mistral OCR

  • 登录你的 OPL 数据空间实例
  • 进入 管理员面板
  • 点击 设置
  • 打开 Documents 标签页
  • Default content extraction engine 改为 Mistral OCR
  • 在对应字段中粘贴 API Key
  • 保存设置

验证 Mistral OCR

如需通过脚本验证 Mistral OCR 是否正常工作,请参考:https://docs.mistral.ai/capabilities/document/

总结

把 Mistral OCR 接入 OPL 数据空间,是增强文档处理与文本抽取能力的一种简单而直接的方法。配置完成后,你就可以利用它的多语言文本识别和多格式文档解析能力,为 OPL 数据空间提供更强的 AI 文档分析支持。