跳到主要内容

Mistral OCR

注意

本教程为社区贡献内容，不属于 OPL 数据空间团队的官方支持范围。它主要演示如何按你的具体场景定制 OPL 数据空间。若想参与贡献，请查看贡献指南。

👁️ Mistral OCR

本文介绍如何把 Mistral OCR 集成到 OPL 数据空间。Mistral OCR 是一套光学字符识别能力，用于从扫描 PDF、图片、手写文档等图像型文件中提取文本，并输出 JSON 或纯文本等结构化内容。它在多语言识别、版面分析和手写理解方面表现较强。

前置条件

OPL 数据空间实例
Mistral AI 账户

集成步骤

第 1 步：注册或登录 Mistral AI 控制台

访问 https://console.mistral.ai
按页面提示完成注册或登录
成功授权后进入 Console Home

第 2 步：生成 API Key

打开 API Keys，或直接访问 https://console.mistral.ai/api-keys
创建新的 key，并妥善复制保存

第 3 步：在 OPL 数据空间中启用 Mistral OCR

登录你的 OPL 数据空间实例
进入 管理员面板
点击 设置
打开 Documents 标签页
将 Default content extraction engine 改为 Mistral OCR
在对应字段中粘贴 API Key
保存设置

验证 Mistral OCR

如需通过脚本验证 Mistral OCR 是否正常工作，请参考：https://docs.mistral.ai/capabilities/document/

总结

把 Mistral OCR 接入 OPL 数据空间，是增强文档处理与文本抽取能力的一种简单而直接的方法。配置完成后，你就可以利用它的多语言文本识别和多格式文档解析能力，为 OPL 数据空间提供更强的 AI 文档分析支持。

👁️ Mistral OCR
前置条件
验证 Mistral OCR
- 总结