Mit Intelligent Document Processing verbinden

Prev Next

DocuWare Intelligent Document Processing (IDP) stellt Funktionen mit Techniken der künstlichen Intelligenz für die Verarbeitung und Verwaltung von Dokumenten zur Verfügung:

  • Klassifizieren
    Dokumente z.B. nach Dokumenttyp klassifizieren

  • Extraktion
    Daten werden automatisch aus fast allen Dokumenttypen extrahiert. Dazu gehören Rechnungen, Verträge, HR-Dokumente und E-Mails. Bei Rechnungen können auch Einzelposten erkannt und extrahiert werden.

  • Extraktion mit Handschrift
    IDP erkennt handschriftlichen Text in Bildern oder Dokumenten und extrahiert ihn in bearbeitbaren Text.

In diesem Artikel wird beschrieben, wie Sie DocuWare über einen DocuWare Workflow mit Intelligent Document Processing verbinden.

1. Webservice-Verbindung erstellen

Gehen Sie zu DocuWare Konfiguration > Web Services und erstellen Sie eine Webservice-Verbindung.

Fügen Sie einen Namen hinzu, z. B. "IDP" und die URL des IDP-Dienstes, https://api.natif.ai. Natif.ai ist ein DocuWare eigener Dienst.

connect to IPD_1(1)

2. Hinzufügen einer Aktivität vom Typ Webservice

Wechseln Sie in den DocuWare Workflow Manager und fügen Sie dem Workflow, mit dem Sie IDP verwenden möchten, eine Aktivität vom Typ Webservice hinzu.

Mehr Informationen zur Aktivität Webservice im Workflow Manager

3. Importieren Sie die Spezifikationsdatei mit den Endpunkten

Wählen Sie den Webservice aus, den Sie in Schritt 1 erstellt haben, hier "IDP"

Laden Sie die OpenAPI-Spezifikationsdatei (.json) des IDP-Dienstes herunter, den Sie verwenden möchten, wie hier z. B. Extrahieren,
https://platform.natif.ai/api-hub/workflow/invoice_extraction/documentation.

Die Spezifikationsdatei stellt die Endpunkte bereit, damit Sie die Funktion "Extrahieren" verwenden können.

connect to IPD_2

Importieren Sie die OpenAPI-Spezifikationsdatei (.json) in den Webservice. Nach dem Import werden alle verfügbaren Endpunkte in der Dropdown-Liste aufgelistet.

Wählen Sie den Endpunkt für Extrahieren aus, z. B. POST /processing/invoice_extraction

connect to IPD_3(1)

Fügen Sie die gewünschten Abfrageparameter hinzu, z.B.:

  • Enthalten: Extraktionen

  • wait_for: 60

4. Geben Sie den API-Schlüssel ein

Wechseln Sie zu IDP, um einen API-Schlüssel zu generieren. Geben Sie die URL https://platform.natif.ai/api-keys ein und erstellen Sie einen neuen API-Schlüssel.

Fügen Sie einen Namen und ein Ablaufdatum hinzu, und kopieren Sie secret.

Connect to IPD
Gehen Sie zurück zum Docuware Workflow Manager und geben Sie den Schlüssel in den Request-Header der Webservice-Aktivität ein:  

  • Autorisierung: ApiKey <geheim>
    und

  • Ersetzen Sie <secret> durch das Secret aus IDP

    connect to IPD_5

5. HTTP-Text konfigurieren  

Aktivieren Sie auf der Registerkarte HTTP Body der Webservice-Aktivität das Kontrollkästchen Dokument anhängen.

Wählen Sie im Originalformat oder als PDF ohne Anmerkungen.

  • Mit der Option Im Originalformat wird jede Datei des Dokuments einzeln angehängt.

  • Mit der Option Als PDF ohne Anmerkungen wird eine einzige PDF-Datei erzeugt und angehängt, die alle Dateien des Dokuments enthält.

connect to IPD_6

6. HTTP-Anfrage senden

Kopieren Sie eine beliebige PDF-Beispieldatei in den Ordner %AppData%\DocuWare\Workflow Designer\OpenApi\

Benennen Sie die Datei in "testrequest.pdf" um. Diese Datei wird als Teil der HTTP-Testanforderung gesendet.

Drücken Sie auf Senden und warten Sie auf die Antwort. Das Testdokument wird an den IDP-Dienst gesendet und extrahiert. Sie sollten eine Antwort vom IPD-Dienst erhalten.

connect to IPD_7

7. Ordnen Sie die Daten für eine Antwort zu

Wechseln Sie auf den Reiter Datenzuweisung. Wählen Sie die Datenpunkte für Extrahieren aus der JSON-Antwort aus und weisen Sie sie Ihren Indexfeldern zu, z. B. vendor.name.value, date.value, number.value

connect to IPD_8

Extrahieren und Verarbeiten von Einzelposten und Tabellendaten (ab DocuWare 7.11)

Wählen Sie dazu den entsprechenden  Extrahieren-Datenpunktaus der JSON-Antwort aus und weisen Sie ihn Ihrer Indextabelle zu, z. B. line_item

connect to IPD_9

connect to IPD_10

Ordnen Sie dann jeden Datenpunkt der Einzelposten der entsprechenden Spalte in der Indextabelle zu, z. B. description.value, quantity.value, unit_price.value

connect to IPD_11

Ändern Sie auf der Registerkarte HTTP Response Status Codes das Timeout auf 60 Sekunden.

connect to IPD_12

Begrenzungen

DocuWare IDP hat einige standardmäßige Einschränkungen, z.B. verarbeitet der Dienst nicht mehr als 10 Dokumente pro Sekunde. Berücksichtigen Sie dies bei der Gestaltung Ihres Workflows, und stellen Sie sicher, dass die Anforderungen diese Grenzwerte nicht überschreiten.

Siehe Einschränkungen von DocuWare IDP.