Webアプリ
2025.08.18
見積書・請求書のAI-OCRによる自動入力機能を、Azure Document Intelligenceで実現
概要
請求書・見積書・発注書などのアップロードから、取引先・案件・金額・日付など主要項目を自動抽出し、入力フォームにプリセットする機能を導入しました。OCRには Azure AI Document Intelligence(以下Azure DI)を採用。カスタム抽出により当社スキーマへのマッピング精度を担保しています。
課題
フォーマットがバラバラなPDF/画像の転記作業に時間がかかる
書類管理SaaS間の移行コストが高い
アップロード直後に即時プレビューと候補提示をしたい
要件
PDF/画像(複数同時可)をアップロード → 主要フィールドの自動抽出
アプリケーションで登録された取引先・案件情報との候補突合
非同期にせずともストレスのない応答
セキュア(認証・権限制御、拡張子/サイズ検証、期限付きアクセス)
アーキテクチャ
概要
クライアントからmultipart/form-dataで複数ファイルをPOST
Azure DIでテキスト/構造抽出
DBの取引先/案件をあいまい検索し候補を返却
クライアントは抽出結果+候補をフォームへプリセットして最小修正で確定
シーケンス

Azure Document Intelligenceの選定理由(他方式との比較)
観点 | AWS Textract | Google Document AI | 独自OCR(Tesseract等) | Azure Document Intelligence |
|---|---|---|---|---|
日本語対応 | × 未サポート | ○ 日本語対応 | ○ 日本語対応 | ○ 日本語対応 |
コスト体系 | ページ従量課金のみ | ページ従量課金+ホスティング固定費 | サーバ維持+前処理/辞書管理の人件費 | ページ従量課金のみ(固定費なし) |
精度/汎用性 | 日本語帳票不可 | 高精度 | 入力画像・前処理次第で大幅に変動 | カスタム抽出により精度を継続的に改善可能 |
立ち上げ容易性 | SaaS型で導入簡単 | SaaS型で導入簡単 | 前処理や辞書整備が負担となりやすい | 少量の実データから段階的に開始可能 |
なぜ Azure Document Intelligence なのか
学習の入り口が低い:自社データ約5枚から運用を始めることができ、運用開始後も学習データを追加することで改善可能。
価格体系がシンプル:ページ従量課金が中心で、少量・断続的な利用で固定費を抑えやすい。
継続アップデート:カスタム抽出品質やテーブル抽出の改善が継続。
参考:Azure DIのDocument Intelligence Studio画面

書類を解析するモデルを簡単に作成可能
今後の拡張
学習データの継続追加により、書類の要素のラベリングの精度を改善
Azure DI連携前の前処理(ノイズ除去・傾き補正・トリミング)の強化により、文字列認識の精度を向上
Azure DI結果取得後、HOJORINで保持している取引先名とのパターンマッチ、あいまい検索精度の向上