自動ドキュメント処理による添付ファイルのインデックス作成

Prev Next

一般的なメール/Connect to Mail を用いて作成されたメールインポート構成において、自動ドキュメント処理オプションは DocuWare のドキュメント処理および Intelligent Document Processing (IDP) を利用して基本的なインポートルールよりも高い精度で メールの添付ファイルに自動でインデックスを作成します。 これを有効にすると添付ファイルが分析され、適切な処理構成との照合が行われます。 抽出された値はその後一般的なメール/Connect to Mail に返され、ドキュメントが保存される前にインポート構成のインデックスフィールドに書き込まれます。

これらの構成が連携しながら機能する仕組みは、以下の通りです。

  • インポートの構成:

    "DocuWare の構成" > "一般的なメール" の順に移動した先で設定します。 この構成により DocuWare がメールボックスに接続され、インデックスフィールドが定義され、対象のファイルキャビネットと保存オプションが設定されます。 この構成によって保存された電子請求書が添付されているメールは、リンクされている処理構成に渡されます。
    一般的なメールインポート構成の自動ドキュメント処理オプションは、メールの添付ファイルにのみ適用されます。メールの本文は、インポート構成でこのオプションを有効化している場合にのみ添付ファイルと一緒に保存されます。

  • 処理の構成:
    "DocuWare の構成" > "ドキュメント処理" または "DocuWare の構成" > "DocuWare IDP" の順に移動した先で作成されます。 構成で定義されている関連コンテンツが抽出され、インデックスフィールドに入力されたインデックス値としてインポートジョブに返されます。 この処理構成を一般的なメールインポート構成でリンクします。
    DocuWare のドキュメント処理は、XMLファイルや XML が埋め込まれた PDF などを含む PDF ファイルや電子請求書を処理します。
    ただし、DocuWare IDP が処理できるのは PDF のみです。 XML は IDP ではサポートされていません。

一般的なメールと Connect to Mail

Connect to Mail は、DocuWare オンプレミスで一般的なメール領域を有効化するためのライセンス名です。 DocuWare のバージョンに関わらず、以下の用語はすべて同じものを指しています。"DocuWare の構成""一般的なメール" セクションで作成された自動メールインポートのための構成です。

  • Connect to Mail 構成

  • 一般的なメール構成

  • 一般的なメール/Connect to Mail 構成

  • メールインポート構成

DocuWare Cloud および 7.13 における自動インデックス作成の構成

以下の手順に従って DocuWare のドキュメント処理または DocuWare IDP による自動インデックス作成を構成します。

この記事では、メールのインポートおよびインデックス作成に特有の設定についてのみ説明します。 処理構成の作成に関するガイダンスについては、「ドキュメント処理」のヘルプを参照してください。

  1. "DocuWare の構成" > "キャプチャ" > "一般的なメール" の順に移動します。

  2. 既存のメールインポート構成を選択するか、新しい構成を作成します。

  3. "インポートのオプション""その他のオプション" リンクをクリックし、"ドキュメントの自動処理 (インデックス作成のみ)" チェックボックスをオンにします。

  4. ドロップダウンリストから利用可能な構成オプションを選択し、1 つ以上の処理構成をリンクします。 必要に応じて、以下の自動処理オプションのいずれかを使用して一般的なメール構成を設定することができます。

    • 特定の構成: すべての添付ファイルは、選択されているドキュメント処理構成を用いて処理されます。

    • 自動選択 (ドキュメント処理構成): 受信した添付ファイルが適切なドキュメント処理構成に自動的に照合されて処理が行われます。 他のモジュールからドキュメント処理構成を自動的に選択できるようにするには、ドキュメント処理構成レベルで識別オプションを有効化する必要があります。

    • 自動選択 (IDP の構成): 各添付ファイルは、最適な DocuWare IDP 構成を使用して自動的に分析および処理が行われます。

    • 自動選択 (すべての構成の組み合わせ): ファイル形式やそのプロパティに応じて、ドキュメント処理または DocuWare IDP 構成の中から最適な構成が選択されます。

IDP とドキュメント処理の比較

DocuWare の Intelligent Document Processing (IDP) とドキュメント処理は、どちらも DocuWare でのインデックス作成に必要となるデータを抽出します。 ドキュメント処理が構造化または半構造化されたドキュメントに焦点を当てているのに対し、IDP は構造化されていないドキュメントを自動的に分類し、乱雑なレイアウトや手書きのコンテンツにも対応することができます。 自動化されたメール添付ファイル処理のニーズに合致するモジュールを使用して処理構成を設定します。 詳細については、以下の表を参照してください。

ドキュメント処理

DocuWare IDP

DocuWare のバージョン

  • DocuWare Cloud

  • DocuWare オンプレミス

  • DocuWare Cloud のみ

詳細情報

処理された添付ファイルの種類

  • PDF

  • XML (電子請求書)

  • XML が埋め込まれた PDF (電子請求書)

  • PDF のみ

主なユースケース

  • 構造化されたドキュメントの抽出

  • 管理者による処理手順の事前定義

  • 管理者による読み取り領域の手動定義

  • 様々なソースから集められた非構造化ドキュメントの分類

  • ドキュメントの文脈の理解

  • ドキュメントの種類の認識

  • 手書きのドキュメントを推奨

ドキュメントの分割

  • 事前定義された固定間隔での分割 (例: 数ページごと)

  • 自動化されたコンテンツ認識による分割

  • ドキュメントの境界の検出

DocuWare オンプレミス 7.11 および 7.12 における自動インデックス作成の構成

DocuWare のバージョン 7.11 および 7.12 では、ドキュメント処理構成を使用してメールの添付ファイルにインデックスを作成することができます。 Docuware IDP の埋め込みは Docuware のバージョン 7.13 以降および DocuWare Cloud でのみサポートされています。

1 件の処理構成ごとに一般的なメール/Connect to Mail 構成を 1 つ設定し、以下のようにインポートの構成で手動で処理構成を選択する必要があります。

  1. "DocuWare の構成" > "キャプチャ" > "一般的なメール" の順に移動します。

  2. 既存のメールインポート構成を選択するか、新しい構成を作成します。

  3. "インポートのオプション""その他のオプション" リンクをクリックし、"ドキュメントの自動処理 (インデックス作成のみ)" チェックボックスをオンにします。

  4. ドロップダウンリストからオプションを選択し、ドキュメント処理構成をリンクします。詳細は以下を参照してください。

処理構成ごとに 1 件のインポートを作成する

DocuWare オンプレミス 7.11 または 7.12 では、メールボックスに適用するドキュメント処理構成のそれぞれに対して一般的なメール構成を個別に作成します。    

複数の添付ファイルを処理する場合の構成

1 件のメールに複数の添付ファイルが含まれており、それらを自動ドキュメント処理を使用してインデックス化する場合、次の 2 つの方法があります。

1. メールと添付ファイルの個別保存

一般的なメールインポート構成で、"メールと添付ファイルを個別に保存" オプションを有効にします。 これにより、DocuWare は各添付ファイルを個別のドキュメントとしてインデックス化して保存します。 DocuWare ではこのオプションが推奨されています。

2. メールとすべての添付ファイルをクリップされたドキュメントとして保存

または、一般的なメールインポート構成で "メールとすべての添付ファイルをクリップされた 1 つのドキュメントとして保存" オプションを有効にすることもできます。 この場合、DocuWare は、メールとすべての添付ファイルを 1 つのクリップされたドキュメントとしてまとめてインデックス化して保存します。 結果は添付ファイルの形式に応じて以下のように異なってきます。

  • 複数の PDF または電子請求書 (PDF または XML) ファイルが処理される場合。

    メールには処理可能なファイルが複数含まれます。 "処理可能" とは、PDF または電子請求書 (PDF または XML) を意味しています。 DocuWare では、1 つのクリップされたドキュメントとして保存する場合に選択した処理設定を複数の候補に対して実行することができません。 このような場合にはフォールバック動作が適用され、クリップされたドキュメントは、以下に説明する通りに一般的なメール構成の設定を用いて保存されるか、規定のトレイへと送信されます。

  • 1 件の PDF または電子請求書 (PDF または XML) ファイルのみが処理される場合。

    DocuWare は処理可能な添付ファイル (PDF または XML ファイル) に対して選択された処理構成を適用し、メールとすべての添付ファイルを 1 つのクリップされたドキュメントとして保存してインデックス化します。 DocuWare は、後述するソースの優先度に従ってこれらのフィールドを埋めていきます。 利用可能な構成のいずれかで処理を行うことができない場合には、フォールバック動作が適用されます。詳細は以下の通りです。

  • その他すべての添付ファイル形式 (PDF および電子請求書以外) の場合。

    メールには処理可能なファイルが含まれません。 クリップされたドキュメントは一般的なメール構成を用いて保存されます。

ソースの優先度

抽出された値は一般的なメール/Connect to Mail に返され、インデックスフィールドに適用されます。 あるフィールドが 1 件のソースにより事前入力されている場合、その値は優先度の低いソースを上書きします。 DocuWare は以下のソースの優先度に基づいてこれらのフィールドを埋めていきます。

  • 保存場所 (読み取り専用) によって事前定義されているインデックス値 (例: ファイルキャビネットの保存ダイアログ)

  • ドキュメント処理/IDP によって読み出されたインデックス値

  • 一般的なメール/Connect to Mail 構成で定義されているインデックス値

フォールバック動作

ドキュメントに一致するドキュメント処理構成が見つからない場合、または複数の構成が一致する場合、電子請求書の添付ファイルは処理されません。 次に発生する処理は、"自動処理ができない場合に一般的なメールのインデックス作成設定を適用する" 設定に依存します。

  • 有効化されている場合: 電子請求書は一般的なメール構成で定義されているファイルキャビネットに保存され、それらのインデックス値が適用されます。

  • 無効化されている場合: 電子請求書はデフォルトの文書トレイに振り分けられます。

いずれの場合でも、状態を示すメッセージがドキュメントに書き込まれます (例:「一致する構成が見つかりません...」または「複数の一致する構成が見つかりました...」)。

現在の制限事項とトラブルシューティング

DocuWare Cloud および DocuWare オンプレミス 7.11 から 7.13

一般的なメールと DocuWare IDP/ドキュメント処理を組み合わせた添付ファイル処理には、以下のような制限事項があります。

  • 処理サービス: ドキュメントの最大サイズは 10 MB、XML の複雑さの上限が適用されます。

  • インデックステーブル: テーブルフィールドは最大で 1000 行 (請求書の項目の行数) までしか保存できません。 この上限を超える大きな請求書については、特別な処理が必要です。

  • 複数のメール添付ファイル: 一般的なメール/Connect to Mail では、一度に処理できる添付ファイルは 1 件のみとなっています。 メールに複数の添付ファイルが含まれている場合、構成で "メールと添付ファイルを個別に保存する" オプションを有効にします。 これにより、各添付ファイルに対して個別に保存や処理を行うことができるようになります。

  • 保存形式: ドキュメント処理または IDP でメールの添付ファイルをインデックス化する場合には、メールの本文を元の形式 (.eml) で保存します。 これによって添付ファイルが処理の対象として維持されるようになり、本文の PDF がこれに取って代わることを防止できるようになります。

  • インデックス作成: 同一のドキュメントにおいて自動ドキュメント処理と一般的なメールのインデックス作成を併用することはできません (例: 処理を介したフィールドと一般的なメールを介したメール本文の併用)。

DocuWare Cloud + 7.13 + 7.12 + 7.11