DocuWare storageRobot ist ein Spezialtool für automatischen Dokumentenimport bei komplexen Szenarien, wie zum Beispiel bei der Anbindung von externen ERP- und Warenwirtschaftssystemen.
Mehr Informationen zum Einsatz von DocuWare storageRobot
Zudem kann storageRobot den KI-gestützten Service DocuWare Intelligent Document Processing (IDP) mit der Methode “Dokumententrennung”, bzw. “Splitting” anwenden. Stapelscans werden dabei auch ohne Trennseiten oder Barcode-Aufkleber automatisch in separate Dokumente geteilt. Die einzelnen PDFs können dann in unternehmensweiten Workflows weiterverarbeitet werden.
Mehr Informationen zur Einrichtung von DocuWare IDP mit storageRobot
storageRobot führt den Dokumentimport in der Regel automatisiert aus. Importkonfigurationen sind entweder zeitgesteuert oder aktivieren sich automatisch, wenn im Dateisystem auf einem Server Dokumente oder Metadaten neu gespeichert oder geändert werden.
Die Importkonfigurationen lassen sich im storageRobot Administration Tool einrichten, das mit anderen Programmkomponenten heruntergeladen und lokal installiert werden kann.
Einrichten von Importkonfigurationen
Das storageRobot Administration Tool bietet ein zentrales Hauptfenster sowie einen Assistenten.
Im Hauptfenster erstellen oder bearbeiten Sie neue, automatische Importkonfigurationen. Auch können Sie hier eine Konfiguration manuell ausführen, beispielsweise, um die Einstellungen einer Ersteinrichtung zu testen. Zudem spielen Sie im Hauptfenster den Lizenzschlüssel ein, rufen Updates ab oder greifen auf Logdateien zu.
Der Assistent führt Schritt für Schritt durch die Erstellung einer neuen Konfiguration. Je nach Art der Konfiguration stehen unterschiedliche Funktionen zur Auswahl. Beispielsweise sind bei der Ablage von Dokumenten in das Dateisystem andere Einstellungen erforderlich als bei der Ablage in einem Archiv.
Hinweis: Die Einstellungen werden erst im letzten Schritt des Assistenten mit dem Button Fertigstellen gespeichert.
Wichtige Funktionen im storageRobot-Assistenten auf einen Blick
Diese Funktionen stehen in jedem Assistenten von storageRobot zur Verfügung:
Speicherort
Beispieldokument
IDP
Werte von Platzhaltern ersetzen
Platzhalterprüfung
Speicherort vom Quelldokument
Geben Sie die Quelle für die zu importierenden Dokumente an. Als Speicherort stehen Dateisystem, DocuWare Briefkorb, FTP und Metadateien zur Auswahl.
Neben der Quelle für die zu importierenden Dokumente können Sie einen Ordner angeben, in welchen ein Dokument bei einem Fehler in der Verarbeitung kopiert wird.
Dateisystem
Mit dieser Optionen werden Dateien von einem lokalen Ordner oder einem UNC Pfad bearbeitet.
Dateien Ein-/Ausschließen: Wenn Sie nur bestimmte Dateitypen oder Unterordner aus dem Quellordner verarbeiten möchten, können Sie Dateitypen und Unterordner individuell unter den folgenden Punkten ein- oder ausschließen.
Das Ein- oder Ausschließen von Unterordnern funktioniert nur, wenn die Suchoption AllDirectories ausgewählt ist.Dateimuster einschließen: Hier können Sie Dateitypen oder Unterordner individuell in die Verarbeitung einschließen. Wenn dieses Feld leer ist, verarbeitet storageRobot standardmäßig alle Dokumente.
Nur definierte Dateitypen einschließen: Zum Beispiel, wenn nur PDF-Dokumente archiviert werden sollen, müssen Sie
*.pdf
in dieses Feld eingeben. storageRobot verarbeitet dann ausschließlich alles (*) mit dem Dateityp ".pdf".Diese Funktion funktioniert auch mit mehreren Dateitypen. Die einzelnen Filter müssen durch ein Komma getrennt werden. Beispiel:
*.pdf,*.jpg
Alle Dateitypen in definierten Unterordnern einschließen: Wenn der Quellordner Unterordner wie "Eingangsrechnungen," "Ausgangsrechnungen," "Bestellungen" und "Lieferscheine" enthält und nur der Ordner "Eingangsrechnungen" verarbeitet werden soll, müssen Sie
*\Eingangsrechnungen\*.*
in dieses Feld eingeben. storageRobot verarbeitet dann nur die Dokumente im Unterordner "Eingangsrechnungen".Mehrere Unterordner können ebenfalls durch Komma getrennt eingeschlossen werden. Beispiel:
*\Eingangsrechnungen\*.*, *\Ausgangsrechnungen\*.*
Nur definierte Dateitypen in definierten Unterordnern einschließen: Die oben beschriebenen Funktionen können auch kombiniert werden, sodass beispielsweise nur alle PDF-Dateien aus den Unterordnern "Eingangsrechnungen" und "Ausgangsrechnungen" verarbeitet werden. Die korrekte Syntax wäre dann
*\Eingangsrechnungen\*.pdf, *\Ausgangsrechnungen\*.pdf
.Dateimuster ausschließen: Hier können Sie Dateitypen oder Unterordner individuell von der Verarbeitung ausschließen. Wenn dieses Feld leer ist, verarbeitet storageRobot standardmäßig alle Dokumente. Es funktioniert identisch wie das "Dateimuster einschließen".
Mindestalter: Es kann nützlich sein, das Alter einer Datei zu überprüfen, zum Beispiel, wenn Sie möchten, dass eine Datei erst verarbeitet wird, nachdem sie vollständig im Ordner angekommen ist.
Zu diesem Zweck geben Sie das Mindestalter in Sekunden ein. storageRobot überprüft dann bei jedem Lauf, ob die Datei diese Regel erfüllt. Wenn ja, wird die Datei verarbeitet; wenn nein, bleibt sie im Ordner.Zip-Dateien: ZIP-Dateien lesen wird storageRobot anweisen, nur nach ZIP-Dateien im Dokumentenstandort zu suchen. Diese Dateien werden extrahiert und wie ein Ordner behandelt. Ein-/Ausschlussmuster und andere Optionen werden auf den Inhalt der ZIP-Dateien angewendet.
DocuWare Briefkorb
Es werden Dateien aus einem Docuware Briefkorb verarbeitet.
FTP
Es werden Dateien von einem FTP oder SFTP Server verarbeitet.
Metaddatein
Metadateien ist ein Verarbeitungsmodus, der dazu dient, Indexdaten bereits gespeicherter Dokumente zu aktualisieren.
Beispieldokument
Die hier gewählte und eingerichtete Datei wird in den nachfolgenden Konfigurationsschritten immer wieder verwendet, um Einstellungen vorzunehmen.
IDP
Detaillierte Informationen zur Konfiguration von IDP in storageRobot finden Sie unten im Kapitel DocuWare IDP mit storageRobot
Werte von Platzhaltern ersetzen
Legen Sie hier zum Beispiel fest, dass der Wert “RE” eines Barcodes als “Rechnung” in ein Indexfeld eingetragen wird (optional).
Platzhalterprüfung
Ein klassisches Beispiel für eine Platzhalterprüfung ist die Verwendung von einem Wert aus einem Barcode für eine Datenbankabfrage. Das Dokument soll erst dann abgelegt werden, wenn die Abfrage die erforderlichen Informationen geliefert hat. Sofern der SQL-Platzhalter nicht gefüllt ist, kann das Dokument in den Fehlerordner verschoben werden.
Datumsformat
Wenn die zu importierenden Dokumente ein Datum enthalten, das nicht dem Standard TT.MM.JJJJ
entspricht, kann storageRobot diesen Wert in ein für DocuWare gültiges Format konvertieren.
Fügen Sie über das Plus-Symbol das Feld hinzu, das aus dem Importdokument ausgelesen werden soll und dem Feldtyp Datum-Uhrzeit zugeordnet ist.
Als Lesebereiche können alle in der storageRobot-Konfiguration verfügbaren Optionen verwendet werden, einschließlich FileProperty, OCR, Barcode und SQL.
Format: Geben Sie für den Wert das vorliegende Format an, damit storageRobot ihn beim Import erkennt und konvertieren kann.
Häufige Format-Strings sind in der folgenden Tabelle gelistet. Mehr Informationen und eine komplette Übersicht über die Formate bei Microsoft.
Format | Beschreibung |
---|---|
yyyy | Jahr (4 Zeichen, z.B. 2024) |
yy | Jahr (2 Zeichen, z.B. 24) |
MM | Monat (mit führender Null, z.B. 01 - 12) |
M | Monat (ohne führende Null, z.B. 1 - 12) |
dd | Tag (mit führender Null, z.B. 01 - 31) |
d | Tag (ohne führende Null, z.B. 1 - 31) |
HH | Stunde (mit führender Null, z.B. 00-23) |
mm | Minute (mit führender Null, z.B. 00-59) |
ss | Sekunden (mit führender Null, z.B. 00-59) |
Hinweis
Groß- und Kleinschreibung verändert die Bedeutung der Formatzeichenfolgen.
DocuWare IDP mit storageRobot
Die KI hinter DocuWare Intelligent Document Processing (IDP) wird darauf trainiert, verschiedene Dokumenttypen wie Rechnungen und Lieferscheine zu klassifizieren und relevante Daten daraus zu extrahieren. Diese Klassifikationen und Extraktionsmodelle können in storageRobot für die automatische Indexierung beim Import verwendet werden. Auch Scanstapel kann storageRobot mit DocuWare IDP auch ohne Barcodes trennen und automatisch indexieren.
Mehr Informationen zu DocuWare IDP
Allgemeines zu DocuWare IDP auf der DocuWare Webseite
DocuWare IDP für storageRobot einrichten
Um DocuWare IDP für die Verwendung in storageRobot zu einzurichten, verwenden Sie im Administration Tool den Assistenten DocuWare IDP. Sie können dabei auch die anderen Funktionen von storageRobot verwenden. Nur die die storageRobot-eigenen Funktionen zur Dokumenttrennung stehen nicht zur Verfügung, sofern DocuWare IDP mit Splitting verwendet wird.
.png)
Im Hauptfenster des DocuWare IDP-Assistenten verbinden Sie storageRobot mit DocuWare IDP
Nehmen Sie folgende Einstellungen vor:
API URL: Geben Sie die URL für DocuWare IDP ein.
Wenn Sie sich in der EU befinden, reicht ein Klick auf EU-Standard.
Wenn Sie sich in den USA befinden, klicken Sie auf US-Standard.API Key: Den Schlüssel für die Verbindung per API finden Sie in Ihrem Konto bei natif.ai. Bei Fragen wenden Sie sich an Ihren DocuWare Kontakt.
Refresh Workflows: Nachdem Sie storageRobot mit DocuWare IDP über die API verbunden haben, laden Sie mit dem Button Refresh Workflows die unter DocuWare IDP vorhandenen Konfigurationen wie Klassifikationen und Extraktionsmodelle. Diese stehen dann weiter unten in diesem Dialog unter Select Workflows zur Verfügung.
Ein “Workflow” bezeichnet hier eine Konfiguration von DocuWare IDP, die auf Funktionstypen wie Klassifikation, Extraktion oder Splitting beruht. Ein DocuWare Workflow ist in diesem Zusammenhang nicht gemeint.Select Workflow: Wählen Sie eine Konfiguration, bzw. einen “Workflow” von DocuWare IDP aus, die Sie für den Import mit storageRobot verwenden möchten. storageRobot unterstützt folgende Konfigurationen von DocuWare IDP:
Splitting: DocuWare IDP trennt Dokumentenstapel automatisch in einzelne Dokumente trennen.
Extraktion: Daten werden automatisch aus fast allen Dokumenttypen extrahiert. Dazu gehören Rechnungen, Verträge, HR-Dokumente und E-Mails. Bei Rechnungen können auch Einzelposten erkannt und extrahiert werden.
Klassifikation: Dokumente z.B. nach Dokumenttyp klassifizieren
Zusätzliche Funktionen wie Cropping und OCR unterstützt storageRobot ebenfalls.
Nochmal der Hinweis: “Workflow” bezeichnet hier eine Konfiguration von DocuWare IDP und meint hier keine DocuWare Workflows:Maximum Wait Time (Maximale Wartezeit): Die Maximum Wait Time gibt an, wie lange das System auf eine Antwort von DocuWare IDP warten soll, wenn ein Dokument verarbeitet wird. Diese Zeit wird in Sekunden angegeben.
Was bedeutet das für Sie? Wenn Sie eine Zeit einstellen, wartet das System so lange, wie Sie angegeben haben, auf eine Antwort. Wenn die Dokumentenverarbeitung innerhalb dieser Zeit abgeschlossen wird, ist keine weitere Aktion nötig.
Was passiert bei einer Verzögerung? Wenn die Verarbeitungszeit länger dauert als die eingestellte Maximum Wait Time, pausiert das System und benennt das Originaldokument um (Erweiterung: .dwidp.original).
Zusätzlich wird eine neue Datei (Erweiterung: .dwidp) erstellt. Das System verarbeitet die Dokumente zu einem späteren Zeitpunkt weiter, ohne dass Sie manuell eingreifen müssen.
Wichtig bei 0 Sekunden: Wenn Sie 0 Sekunden als Maximum Wait Time einstellen, wird immer eine verzögerte Verarbeitung ausgelöst. Das System markiert die Dokumente sofort zur späteren Verarbeitung.
Zusätzliche Hinweise zum Einrichten der Importkonfiguration für DocuWare IDP
Je nachdem, welchen Konfigurationstyp Sie in DocuWare IDP ausgewählt haben, ändern sich im IDP-Assistenten von storageRobot die angezeigten Elemente:
Splitting: Wenn Sie eine Konfiguration vom Typ Splitting verwenden, können Sie einen Konfidenz-Wert eingeben.
Minimale Konfidenz ist ein Wert zwischen 1 und 100. Dieser gibt an, wie sicher DocuWare IDP ist, dass ein erkannter Trennpunkt korrekt ist. Je höher Sie diesen Wert setzen, desto geringer ist die Wahrscheinlichkeit, dass ein Dokument falsch getrennt wird, aber die Ablehnungsrate ist unter Umständen deutlich höher.
Wenn die Konfidenz eines Trennpunkts unter dem eingestellten Wert liegt, wird das gesamte Dokument als Fehler betrachtet und in den Pfad mit niedriger Konfidenz verschoben. Wenn Sie hier keine Angabe machen, verwendet storageRobot das zuvor konfigurierte Fehlerverzeichnis.
Andere Docuware IDP-Techniken: Wenn Sie die Option Analyze Sample Document verwenden, wird das zuvor ausgewählte Beispieldokument an die API gesendet und ausgewertet. Die Ergebnisse stehen anschließend für die spätere Verwendung im Assistenten zur Verfügung.
Für die IDP-Verarbeitung des Sample Dokuments können Kosten anfallen. Mehr Informationen dazu finden Sie in der DocuWare Preisliste oder wenden Sie sich im Zweifel an Ihren DocuWare Kontakt.
In einigen Fällen erzeugt die IDP aus Ihrem Dokument eine neue PDF-Datei. Diese PDFs können eine beschnittene Version der Originaldatei sein oder zusätzlichen Text enthalten, falls eine OCR-Anwendung durchgeführt wurde. Aktivieren Sie "IDP-generierte PDF-Datei verwenden", um dieses PDF anstelle des Originaldokuments zu nutzen.
Extrahierte Informationen den DocuWare Indexfeldern zuordnen
Eine IDP Importkonfiguration liest aus den importierten Dokumenten je nach Typ unterschiedliche Informationen aus und ordnet diese extrahierten Informationen automatisch bestimmten Platzhaltern von storageRobot zu.
In storageRobot werden diese Platzhalter wiederum mit den DocuWare Indexfeldern verknüpft, so dass schließlich die extrahierten Metadaten als Indexdaten zum importierten Dokument im DocuWare Archiv abgelegt werden.
Einige Platzhalter von storageRobot sind für alle Konfigurationstypen von IDP gleich, zum Beispiel
{IDP_WorkflowId}
Workflow ID{IDP_ProcessingId}
Bearbeitungsnummer{IDP_ClassifiedAs}
Ergebnis der Klassifizierung
Die Platzhalter, die auf Basis einer Extrahierung erstellt wurden, werden dynamisch in Abhängigkeit vom gewählten IDP-Workflow und den dort angelegten Feldern und vorgenommenen Annotationen generiert, zum Beispiel:
{IDP_DocumentType}
Dokumenttyp{IDP_SenderCity}
Stadt vom Absender
Im folgenden Screenshot ist ein Beispiel für die storageRobot-Platzhalter einer Extraktions-Konfiguration zu sehen:storage-Robot Platzhalter für eine IDP Extraktion
Zum Vergleich: Diese Platzhalter beruhen auf folgenden Metadaten in DocuWare IDP:
{IDP_SenderCity}
= Sender > City
{IDP_ReceiverCity}
= Receiver > City
.png)
Konfigurationsoberfläche von DocuWare IDP mit Platzhaltern