Mistral OCR
注意
本教程为社区贡献内容,不属于 OPL 数据空间团队的官方支持范围。它主要演示如何按你的具体场景定制 OPL 数据空间。若想参与贡献,请查看贡献指南。
👁️ Mistral OCR
本文介绍如何把 Mistral OCR 集成到 OPL 数据空间。Mistral OCR 是一套光学字符识别能力,用于从扫描 PDF、图片、手写文档等图像型文件中提取文本,并输出 JSON 或纯文本等结构化内容。它在多语言识别、版面分析和手写理解方面表现较强。
前置条件
- OPL 数据空间实例
- Mistral AI 账户
集成步骤
第 1 步:注册或登录 Mistral AI 控制台
- 访问
https://console.mistral.ai - 按页面提示完成注册或登录
- 成功授权后进入 Console Home
第 2 步:生成 API Key
- 打开
API Keys,或直接访问https://console.mistral.ai/api-keys - 创建新的 key,并妥善复制保存
第 3 步:在 OPL 数据空间中启用 Mistral OCR
- 登录你的 OPL 数据空间实例
- 进入
管理员面板 - 点击
设置 - 打开
Documents标签页 - 将
Defaultcontent extraction engine 改为Mistral OCR - 在对应字段中粘贴 API Key
- 保存设置
验证 Mistral OCR
如需通过脚本验证 Mistral OCR 是否正常工作,请参考:https://docs.mistral.ai/capabilities/document/
总结
把 Mistral OCR 接入 OPL 数据空间,是增强文档处理与文本抽取能力的一种简单而直接的方法。配置完成后,你就可以利用它的多语言文本识别和多格式文档解析能力,为 OPL 数据空间提供更强的 AI 文档分析支持。