Webアプリ

    2025.08.18

    見積書・請求書のAI-OCRによる自動入力機能を、Azure Document Intelligenceで実現

    概要

    請求書・見積書・発注書などのアップロードから、取引先・案件・金額・日付など主要項目を自動抽出し、入力フォームにプリセットする機能を導入しました。OCRには Azure AI Document Intelligence(以下Azure DI)を採用。カスタム抽出により当社スキーマへのマッピング精度を担保しています。

    課題

    • フォーマットがバラバラなPDF/画像の転記作業に時間がかかる

    • 書類管理SaaS間の移行コストが高い

    • アップロード直後に即時プレビュー候補提示をしたい

    要件

    1. PDF/画像(複数同時可)をアップロード → 主要フィールドの自動抽出

    2. アプリケーションで登録された取引先・案件情報との候補突合

    3. 非同期にせずともストレスのない応答

    4. セキュア(認証・権限制御、拡張子/サイズ検証、期限付きアクセス)

    アーキテクチャ

    概要

    1. クライアントからmultipart/form-dataで複数ファイルをPOST

    2. Azure DIでテキスト/構造抽出

    3. DBの取引先/案件をあいまい検索し候補を返却

    4. クライアントは抽出結果+候補をフォームへプリセットして最小修正で確定

    シーケンス

    シーケンス図

    Azure Document Intelligenceの選定理由(他方式との比較)

    観点

    AWS Textract

    Google Document AI

    独自OCR(Tesseract等)

    Azure Document Intelligence

    日本語対応

    × 未サポート

    ○ 日本語対応

    ○ 日本語対応

    ○ 日本語対応

    コスト体系

    ページ従量課金のみ

    ページ従量課金+ホスティング固定費

    サーバ維持+前処理/辞書管理の人件費

    ページ従量課金のみ(固定費なし)

    精度/汎用性

    日本語帳票不可

    高精度

    入力画像・前処理次第で大幅に変動

    カスタム抽出により精度を継続的に改善可能

    立ち上げ容易性

    SaaS型で導入簡単

    SaaS型で導入簡単

    前処理や辞書整備が負担となりやすい

    少量の実データから段階的に開始可能

    なぜ Azure Document Intelligence なのか

    • 学習の入り口が低い自社データ約5枚から運用を始めることができ、運用開始後も学習データを追加することで改善可能。

    • 価格体系がシンプルページ従量課金が中心で、少量・断続的な利用で固定費を抑えやすい

    • 継続アップデート:カスタム抽出品質やテーブル抽出の改善が継続。

    参考:Azure DIのDocument Intelligence Studio画面

    Azure DIのDocument Intelligence Studio画面

    書類を解析するモデルを簡単に作成可能

    今後の拡張

    • 学習データの継続追加により、書類の要素のラベリングの精度を改善

    • Azure DI連携前の前処理(ノイズ除去・傾き補正・トリミング)の強化により、文字列認識の精度を向上

    • Azure DI結果取得後、HOJORINで保持している取引先名とのパターンマッチ、あいまい検索精度の向上

    お問い合わせはこちら
    ホーム

    |

    システム開発事業

    |

    開発事例

    |

    見積書・請求書のAI-OCRによる自動入力機能を、Azure Document Intelligenceで実現

    お問い合わせ

    サービスに関するご質問や、取材・パートナーシップのご相談などはこちらからお気軽にご連絡ください。

    trending_flat

    お問い合わせはこちら

    採用について

    チームのビジョンに共感し、共に前進できる仲間を探しています。一緒に働いてみませんか?

    launch

    採用情報はこちら