フランスのAIスタートアップ企業のMistral AI(ミストラルAI)は、光学文字認識(OCR)技術を用いたドキュメント理解API「Mistral OCR」を発表した。価格は1,000ページあたり1ドルで、APIプラットフォーム「la Plateforme」を通じて利用可能。
Mistral OCRは、画像やPDFを入力し、順序を保持した形でテキストと画像を抽出できる。また、複雑なレイアウトの文書やマルチモーダルドキュメント(スライド資料や科学論文など)にも対応し、高度な構造解析を実現している。
同社は、OCR性能を評価するベンチマークにおいて、GoogleドキュメントAIやAzure OCR、GPT-4oなどほかの主要なモデルを上回るスコアを記録。特に数学、スキャン文書、多言語処理、表解析の分野で優れた精度を示したという。さらに、毎分最大2,000ページの高速処理を実現している。
価格は1,000ページあたり1ドルで、APIは「la Plateforme」経由で利用できるほか、同社のLLM「le Chat」でも無料試用が可能。今後、クラウドパートナーやオンプレミス環境での展開も予定している。
