DocuWare Intelligent Document Processing (IDP) stellt Funktionen mit Techniken der künstlichen Intelligenz für die Verarbeitung und Verwaltung von Dokumenten zur Verfügung:
Klassifizieren
Dokumente z.B. nach Dokumenttyp klassifizierenExtraktion
Daten werden automatisch aus fast allen Dokumenttypen extrahiert. Dazu gehören Rechnungen, Verträge, HR-Dokumente und E-Mails. Bei Rechnungen können auch Einzelposten erkannt und extrahiert werden.Extraktion mit Handschrift
IDP erkennt handschriftlichen Text in Bildern oder Dokumenten und extrahiert ihn in bearbeitbaren Text.
In diesem Artikel wird beschrieben, wie Sie DocuWare über einen DocuWare Workflow mit Intelligent Document Processing verbinden.
1. Webservice-Verbindung erstellen
Gehen Sie zu DocuWare Konfiguration > Web Services und erstellen Sie eine Webservice-Verbindung.
Fügen Sie einen Namen hinzu, z. B. "IDP" und die URL des IDP-Dienstes, https://api.natif.ai. Natif.ai ist ein DocuWare eigener Dienst.
2. Hinzufügen einer Aktivität vom Typ Webservice
Wechseln Sie in den DocuWare Workflow Manager und fügen Sie dem Workflow, mit dem Sie IDP verwenden möchten, eine Aktivität vom Typ Webservice hinzu.
Mehr Informationen zur Aktivität Webservice im Workflow Manager
3. Importieren Sie die Spezifikationsdatei mit den Endpunkten
Wählen Sie den Webservice aus, den Sie in Schritt 1 erstellt haben, hier "IDP"
Laden Sie die OpenAPI-Spezifikationsdatei (.json) des IDP-Dienstes herunter, den Sie verwenden möchten, wie hier z. B. Extrahieren,
https://platform.natif.ai/api-hub/workflow/invoice_extraction/documentation.
Die Spezifikationsdatei stellt die Endpunkte bereit, damit Sie die Funktion "Extrahieren" verwenden können.
Importieren Sie die OpenAPI-Spezifikationsdatei (.json) in den Webservice. Nach dem Import werden alle verfügbaren Endpunkte in der Dropdown-Liste aufgelistet.
Wählen Sie den Endpunkt für Extrahieren aus, z. B. POST /processing/invoice_extraction
Fügen Sie die gewünschten Abfrageparameter hinzu, z.B.:
Enthalten: Extraktionen
wait_for: 60
4. Geben Sie den API-Schlüssel ein
Wechseln Sie zu IDP, um einen API-Schlüssel zu generieren. Geben Sie die URL https://platform.natif.ai/api-keys ein und erstellen Sie einen neuen API-Schlüssel.
Fügen Sie einen Namen und ein Ablaufdatum hinzu, und kopieren Sie secret.
Gehen Sie zurück zum Docuware Workflow Manager und geben Sie den Schlüssel in den Request-Header der Webservice-Aktivität ein:
Autorisierung: ApiKey <geheim>
undErsetzen Sie <secret> durch das Secret aus IDP
5. HTTP-Text konfigurieren
Aktivieren Sie auf der Registerkarte HTTP Body der Webservice-Aktivität das Kontrollkästchen Dokument anhängen.
Wählen Sie im Originalformat oder als PDF ohne Anmerkungen.
Mit der Option Im Originalformat wird jede Datei des Dokuments einzeln angehängt.
Mit der Option Als PDF ohne Anmerkungen wird eine einzige PDF-Datei erzeugt und angehängt, die alle Dateien des Dokuments enthält.
6. HTTP-Anfrage senden
Kopieren Sie eine beliebige PDF-Beispieldatei in den Ordner %AppData%\DocuWare\Workflow Designer\OpenApi\
Benennen Sie die Datei in "testrequest.pdf" um. Diese Datei wird als Teil der HTTP-Testanforderung gesendet.
Drücken Sie auf Senden und warten Sie auf die Antwort. Das Testdokument wird an den IDP-Dienst gesendet und extrahiert. Sie sollten eine Antwort vom IPD-Dienst erhalten.
7. Ordnen Sie die Daten für eine Antwort zu
Wechseln Sie auf den Reiter Datenzuweisung. Wählen Sie die Datenpunkte für Extrahieren aus der JSON-Antwort aus und weisen Sie sie Ihren Indexfeldern zu, z. B. vendor.name.value, date.value, number.value
Extrahieren und Verarbeiten von Einzelposten und Tabellendaten (ab DocuWare 7.11)
Wählen Sie dazu den entsprechenden Extrahieren-Datenpunktaus der JSON-Antwort aus und weisen Sie ihn Ihrer Indextabelle zu, z. B. line_item
Ordnen Sie dann jeden Datenpunkt der Einzelposten der entsprechenden Spalte in der Indextabelle zu, z. B. description.value, quantity.value, unit_price.value
Ändern Sie auf der Registerkarte HTTP Response Status Codes das Timeout auf 60 Sekunden.
Begrenzungen
DocuWare IDP hat einige standardmäßige Einschränkungen, z.B. verarbeitet der Dienst nicht mehr als 10 Dokumente pro Sekunde. Berücksichtigen Sie dies bei der Gestaltung Ihres Workflows, und stellen Sie sicher, dass die Anforderungen diese Grenzwerte nicht überschreiten.
Siehe Einschränkungen von DocuWare IDP.