Webアプリ

2025.08.18

見積書・請求書のAI-OCRによる自動入力機能を、Azure Document Intelligenceで実現

概要

請求書・見積書・発注書などのアップロードから、取引先・案件・金額・日付など主要項目を自動抽出し、入力フォームにプリセットする機能を導入しました。OCRには Azure AI Document Intelligence（以下Azure DI）を採用。カスタム抽出により当社スキーマへのマッピング精度を担保しています。

課題

フォーマットがバラバラなPDF/画像の転記作業に時間がかかる
書類管理SaaS間の移行コストが高い
アップロード直後に即時プレビューと候補提示をしたい

要件

PDF/画像（複数同時可）をアップロード → 主要フィールドの自動抽出
アプリケーションで登録された取引先・案件情報との候補突合
非同期にせずともストレスのない応答
セキュア（認証・権限制御、拡張子/サイズ検証、期限付きアクセス）

アーキテクチャ

概要

クライアントからmultipart/form-dataで複数ファイルをPOST
Azure DIでテキスト/構造抽出
DBの取引先/案件をあいまい検索し候補を返却
クライアントは抽出結果＋候補をフォームへプリセットして最小修正で確定

シーケンス

シーケンス図

Azure Document Intelligenceの選定理由（他方式との比較）

観点	AWS Textract	Google Document AI	独自OCR（Tesseract等）	Azure Document Intelligence
日本語対応	× 未サポート	○ 日本語対応	○ 日本語対応	○ 日本語対応
コスト体系	ページ従量課金のみ	ページ従量課金＋ホスティング固定費	サーバ維持＋前処理／辞書管理の人件費	ページ従量課金のみ（固定費なし）
精度/汎用性	日本語帳票不可	高精度	入力画像・前処理次第で大幅に変動	カスタム抽出により精度を継続的に改善可能
立ち上げ容易性	SaaS型で導入簡単	SaaS型で導入簡単	前処理や辞書整備が負担となりやすい	少量の実データから段階的に開始可能

なぜ Azure Document Intelligence なのか

学習の入り口が低い：自社データ約5枚から運用を始めることができ、運用開始後も学習データを追加することで改善可能。
価格体系がシンプル：ページ従量課金が中心で、少量・断続的な利用で固定費を抑えやすい。
継続アップデート：カスタム抽出品質やテーブル抽出の改善が継続。

参考：Azure DIのDocument Intelligence Studio画面

Azure DIのDocument Intelligence Studio画面

書類を解析するモデルを簡単に作成可能

今後の拡張

学習データの継続追加により、書類の要素のラベリングの精度を改善
Azure DI連携前の前処理（ノイズ除去・傾き補正・トリミング）の強化により、文字列認識の精度を向上
Azure DI結果取得後、HOJORINで保持している取引先名とのパターンマッチ、あいまい検索精度の向上

お問い合わせはこちら

実績紹介一覧に戻る

|

システム開発事業

|

|

見積書・請求書のAI-OCRによる自動入力機能を、Azure Document Intelligenceで実現

お問い合わせ

サービスに関するご質問や、取材・パートナーシップのご相談などはこちらからお気軽にご連絡ください。

お問い合わせはこちら

採用について

チームのビジョンに共感し、共に前進できる仲間を探しています。一緒に働いてみませんか？

採用情報はこちら