White Paper On-premises - Archivarchitektur

Prev Next

DocuWare legt alle Dokumente in Archiven ab, wo sie langfristig gespeichert werden. Jedes Archiv ist einer DocuWare Organisation zugeordnet. Die Benutzer greifen in der DocuWare Oberfläche über eine Suchanfrage im jeweiligen Archiv bzw. in mehreren Archiven auf die Dokumente zu.

Jede Organisation hat mindestens ein Archiv für die Dokumentablage. In den Archiveinstellungen bestimmen Sie:

  • allgemeine Angaben zum Archiv, z.B. der Name des Archivs

  • die zu nutzende Datenbank für die Indexinformationen der Dokumente und weitere Datenbank-Einstellungen

  • den zu nutzenden Speicherort für die Dokumente und ggf. dessen Aufteilung in logische Platten mit jeweiliger Kapazitätsbeschränkung

  • Archivfelder und  Indexfelder

  • die Zugriffsrechte und Archivprofile für das Archiv und für einzelne Felder

  • die Benutzerdialoge für Ablage, Suche, Ergebnisliste und Ordnerstrukturen

  • weitere Funktionalitäten, z.B. Verfügbarkeit eines Volltext-Index oder Art und Umfang der für die Dokumentbearbeitung verfügbaren Stempel

Plattenkonzept

Die Dokumente eines Archivs werden in sogenannten DocuWare Platten abgespeichert. DocuWare Platten sind in der Regel Verzeichnisse in der Dateiablage, die einen von DocuWare vorgegebenen Namen tragen. Die Unterteilung der Dokumentablage in logische Platten dient der Organisation der Speichermedien.

Die logischen Platten können jederzeit oder bei Erreichen einer vorher eingestellten Größe von einem auf ein anderes Medium übertragen werden. Bei der Dokumentverwaltung mit DocuWare hat dies den Vorteil, dass Dokumente nach vordefinierten Regeln oder automatisch ausgelagert werden können. DocuWare bietet Funktionen, um die entsprechenden Schritte komfortabel zu automatisieren.

Das Konzept der logischen Platten und die offengelegte Ablagestruktur bieten dem Administrator eine sehr hohe Transparenz und Flexibilität bei der Verwaltung seines DocuWare Systems.

Dokumentstruktur

Ein Dokument in DocuWare kann aus einer einzigen oder mehreren Dateien bestehen. Zudem kann ein Dokument auch aus einer Kombination verschiedener Dateiformate, z.B. PDF/A, PDF, MS Excel, zusammengesetzt sein, etwa wenn DocuWare eine E-Mail mit mehreren Anhängen als zusammengehöriges Dokument übernimmt.

DE_3_Dokumentstruktur

Die Struktur eines Dokuments, das zwei Dateien enthält: eine mit drei und eine mit zwei Seiten

Beispiel 1 (siehe Grafik oben):

Ein 3-seitiges Papierdokument, das durch Scannen in DocuWare erfasst wurde, besteht aus einer 3-seitigen PDF/A-Datei.

Beispiel 2 (siehe Grafik oben):

Für ein Dokument werden eine von DocuWare erzeugte, 3-seitige PDF/A-Datei und eine 2-seitige Word-Datei im Briefkorb zusammengeheftet.

Beispiel 3:

Für ein Dokument werden eine von DocuWare erzeugte PDF/A-Datei, eine 3-seitige Word-Datei und eine 2-seitige PDF-Datei im Briefkorb zusammengeheftet. Das Dokument besteht dann aus drei Dateien:

1. Datei des Dokuments: PDF/A-Datei mit der Seite 1

2. Datei des Dokuments: Word-Datei mit den Seiten 1, 2 und 3

3. Datei des Dokuments: PDF-Datei mit den Seiten 1 und 2

Innerhalb eines Dokuments können auf jeder Seite einer Datei Anmerkungen vorgenommen werden, gegebenenfalls auf mehreren Anmerkungsebenen. Die Anmerkungen werden mit ihren Merkmalen und zusätzlichen Attributen gespeichert und zur Laufzeit durch den DocuWare Viewer reproduziert.

Dokumente in DocuWare können aus maximal 999 Dateien bestehen.

Mit DocuWare Anwendungen gescannte und gedruckte Dokumente werden als PDF/A-Dateien gespeichert. Alle übrigen von DocuWare übernommenen Dokumente, z.B. PDF- und MS Office-Dateien, werden in ihrem Originalformat abgelegt.

Metadaten der Dokumente

Die Metadaten enthalten Informationen zum Dokument wie zum Beispiel Stempel, Indexdaten und Anmerkungen.

Die Medaten werden automatisch in der Archiv-Datenbank gespeichert.

Kopien dieser Daten können optional in einem ZIP-basierten Dateiformat (Erweiterung .DWX) im Archivspeicherort gesichert werden. Dies gilt NUR für DocuWare On-premises. Damit für jedes Dokument eine Metadaten-Datei im DWX-Format erstellt wird, muss in der DocuWare Konfiguration unter Archive die Option Indexdaten-Backup im Speicherort für das Archiv aktiviert sein (Standardeinstellung). Die Daten werden asynchron aktualisiert, nicht als Teil der Dokumentänderung.

Als DWX-Kopie stehen die Dokumente mit ihren Indexdaten selbst bei einem Totalausfall der Datenbank ohne Backup noch vollständig zur Verfügung. Die Wiederherstellung kann allerdings sehr zeitintensiv sein und ist kein Ersatz für eine Datenbanksicherung.

Für das Wiederherstellen von Datenbankeinträgen aus dem Archivspeicherort von DocuWare On-premises steht das Document Tool zur Verfügung.

Wenn der Benutzer ein Dokument aus dem Archiv löscht, wird es in den Papierkorb verschoben und alle Metadaten aus der Datenbank werden in einer TBDWX-Datei gespeichert. Diese Datei wird entfernt, wenn das Dokument wiederhergestellt oder aus dem Papierkorb gelöscht wird.

Jede Dokumentdatei hat einen eindeutigen Namen (GUID). Wird eine Dokumentdatei aktualisiert, wird die Datei im Speicher nicht überschrieben. Stattdessen wird ein neuer eindeutiger Name (GUID) generiert. Nachdem die neue Datei erstellt wurde, wird die alte gelöscht.

Änderung der Ablagestruktur von Version 6.12 und Version 7

Mit DocuWare Version 7 hat sich die Ablagestruktur der Dokumente geändert. Wenn Sie DocuWare On-Premises bereits in der Version 6.12 oder früher genutzt haben, sind Ihre Dokumente in unterschiedlichen Strukturen abgelegt.
Version 6.12 und 7 folgen unmittelbar aufeinander.

  • Ab DocuWare Version 7: Metadaten werden automatisch in der Archiv-Datenbank gespeichert. Kopien dieser Daten können optional in einem ZIP-basierten Dateiformat (DWX) im Archivspeicherort gesichert werden. (Wird die Option nicht genutzt, kann dies einen Performance-Gewinn bedeuten.) Die DWX-Dateien werden asynchron und nicht als Teil der Dokumentänderung aktualisiert.

  • Bis DocuWare Version 6.12: Metadaten wurden bis DocuWare Version 6.12 automatisch in einer Header-Datei pro Dokument  im Archivspeicherort gespeichert.

    Dokumente, die mit einer DocuWare Version 6.x oder früher abgelegt wurden, werden nur dann in die neue Ablagestruktur übertragen, wenn sie bearbeitet oder ihre Indexeinträge geändert werden. Die Ablagestruktur von Dokumenten, die mit einer DocuWare Version 6.x oder früher abgelegt wurden, wird also nicht verändert und ihre Header-Dateien werden weiterhin verwendet.

    Wenn ein solches Dokument in DocuWare ab Version 7 geändert wird (z.B. wenn eine Anmerkung im Viewer angebracht wird), werden die Metadaten des Dokuments in die Datenbank kopiert und die Header-Datei wird gelöscht. Falls die Option zur Speicherung von DWX-Dateien aktiviert ist, wird eine DWX-Datei gespeichert. Es wird die neue Dateinamenskonvention (GUID) verwendet.

    Ab DocuWare Version 7

    Bis DocuWare Version 6.12

    Dokumentdatei-Name

    GUID

    Fortlaufende Nummer (DocID)

    Indexdaten und Annotationen

    DWX Datei (optional)

    Header-Datei (XML)

Volltext-Funktionalität

DocuWare bietet eine eigene Volltext-Funktionalität, die eine effektive Suche im Volltext der Dokumente sowie in deren Indexeinträgen ermöglicht. Die Anwendung ist optional. Die Volltext-Funktionalität läuft wie folgt ab.

Der Background Process Service extrahiert Textshots aus den Dokumenten und speichert diese in der Daten-Datenbank. In den Textshots sind die Suchbegriffe einer Dokumentseite sowie deren Position vermerkt. Dadurch können die Treffer im Dokument markiert werden.

Gleichzeitig übergibt der Background Process Service die Textshots an den Fulltext Server. Dieser wiederum speichert die Textshots in Katalogdateien (Indexdateien) und nutzt sie für die Suchanfragen. Die Katalogdateien werden pro DocuWare Archiv erstellt. Sie sind standardmäßig auf dem Rechner gespeichert, auf dem auch der Fulltext Server installiert ist.

Sollte es beim Indexieren für die Volltextsuche zu einem Fehler kommen, etwa wenn ein Server nicht erreichbar ist, wird die Indexierung dieser Dokumente zu einem späteren Zeitpunkt automatisch wiederholt.

Briefkörbe im Archiv

Das wesentliche Anwendungsszenario für Briefkörbe ist die Sichtung neuer Dokumente und deren Bearbeitung vor der Archivierung. Deshalb erfolgt der Import neuer Dokumente häufig zunächst in einen Briefkorb. Hier findet auch die Auswertung der Dokumente durch Intelligent Indexing statt. Zudem lässt sich ein Briefkorb für Kopien von bereits archivierten Dokumenten nutzen.

Die Briefkörbe sind zwar technisch wie Archive aufgebaut und die Daten werden in einem vereinfachten Format gespeichert. Im Unterschied zu Archiven verfügen Briefkörbe aber weder über eine strukturierte Suche oder eine Volltextsuche noch über ein Rechtekonzept. Sie sind meist so konfiguriert, dass nur ein Benutzer Zugriff darauf hat. Im Vergleich zur analogen Welt entsprechen Sie einem Ablagekorb für den Dokumenteneingang auf dem Schreibtisch.

Prinzipiell ist es auch möglich, mehreren Benutzern Zugriff auf einen Briefkorb zu geben. Dabei gilt es zu beachten, dass im Briefkorb keine Protokollierung stattfindet und keine genauere Vergabe von Rechten möglich ist. Wer Zugriff auf einen Briefkorb hat, darf dort jede Aktion ausführen. Eine einzelne Aktion kann im Nachhinein keinem bestimmten Benutzer zugeordnet werden.

Archiv-Synchronisation

Mit DocuWare lassen sich zwei Archive miteinander synchronisieren (Dokumente und Datenbank).

Die Dokumente werden bei der Synchronisation über eindeutige GUIDs zugeordnet. Eines der zu synchronisierenden Archive muss sich im lokalen System befinden, das andere kann sich im selben oder in einem anderen DocuWare System befinden.

Der Vergleich der Archive erfolgt lediglich über eine Textfeld-Spalte statt und benötigt daher nur wenig Zeit. Der Synchronisationsprozess wird über Cloud-kompatibles HTTPS durch den Background Process Service ausgeführt.