Was bedeutet eigentlich "Digitalisierung" im konkreten Einzelfall? Bei der Digitalisierung von Zeitungen sind ganz unterschiedliche Bearbeitungsniveaus denkbar, die jeweils für sich einen Endpunkt darstellen oder als Schritt auf dem weiteren Bearbeitungsweg angesehen werden können. Abhängig von Ihren Zielen im Digitalisierungsprojekt, können die folgenden Bearbeitungsstufen (vgl. Masterplan, S. 28 ff.) aufeinander aufbauend sämtlich oder teilweise durchgeführt werden:
Grundstandard
- Stufe 1: Erzeugung von digitalen Abbildungen der Zeitungsseiten einschließlich Strukturdaten zur Ermöglichung einer einfachen Navigation seitens der Nutzer
- Stufe 2: Erzeugung von OCROptical Character Recognition-Volltexten
Erweiterter Standard 1
- Stufe 3a: (halb)automatische Artikelseparierung, manuelle Korrekturen von Überschriften
- Stufe 3b: (halb)automatische Artikelseparierung, manuelle Erfassung von Überschriften
Erweiterter Standard 2
- Stufe 4: Normdatenverknüpfung, Named Entity Recognition (NER)
- Stufe 5: vertiefte sachliche Erschließung je nach Anforderung
- Stufe 6: Bilderkennung und -erschließung
Das minimale Ziel sollte das Erreichen des beschriebenen Grundstandards der Stufe 1 sein, über die übrigen Stufen ist im Einzelfall nach Vorlage und Bedarf zu entscheiden.
Die Digitalisierung vom gedruckten Original ermöglicht eine Reproduktion in bester Faksimilequalität und vermittelt einen optimalen Gesamteindruck des Originals. Für eine spätere OCROptical Character Recognition sind die besten Voraussetzungen gegeben. Insbesondere unikale und seltene Zeitungen sowie Zeitungen von besonderem kulturhistorischem Wert, z.B. solche mit wichtigen Bildanteilen, sollten daher vom Original in Farbe oder in Graustufe gescannt werden. Allerdings ist dies auch die zeitaufwändigste und damit kostenträchtigste Vorgehensweise, unabhängig davon, ob inhouse oder mit einem Dienstleister gearbeitet wird.
Die Digitalisierung vom Mikrofilm, sofern vorhanden, schont die fragilen Originale. Gleichzeitig können die mit einer Verfilmung bereits durchgeführten Arbeiten (Verzeichnung, ggf. Lückenergänzung, vgl. Masterplan, S. 27 f.) teilweise nachgenutzt werden. Eine Massendigitalisierung kann relativ schnell und preiswert erfolgen. Bei Verwendung hochwertiger Mikrofilme jüngeren Datums sind bei einer OCROptical Character Recognition-Bearbeitung vergleichbare Ergebnisse wie bei der Digitalisierung vom Original zu erwarten.
In jedem Fall muss vorab geprüft werden, ob die gewählte Vorlage – Papieroriginal oder Mikrofilm – für eine Digitalisierung geeignet ist. Bei der Digitalisierung vom Mikrofilm darf der Nachbearbeitungsauswand nicht vergessen oder unterschätzt werden. Abhängig von der Qualität der Vorlage/der Mikroverfilmung fallen mehr oder weniger zeitaufwändige Korrekturen der automatischen Seitenerkennung an.
Weitere Informationen und Bewertungskriterien zur dieser Frage können Sie dem Masterplan (ab S. 53) sowie der gesonderten Entscheidungshilfe zur Digitalisierung von Original oder Mikrofilm entnehmen.
Bei der Wahl zwischen einer Digitalisierung mit eigenem Personal und Equipment ("Inhouse") und einer Vergabe der Digitalisierung an einen Dienstleister ("Outsourcing") handelt es sich oftmals um eine Grundsatzentscheidung, bei der jenseits des einzelnen Projekts z.B. auch die strategische und personelle Ausrichtung einer Einrichtung eine wichtige Rolle spielen kann. Zahlreiche Faktoren sind von Bedeutung und werden je nach Ausgangslage und Zielvorstellung ganz anders zu gewichten sein.
Wird im eigenen Haus digitalisiert, sind nicht nur die unmittelbar anfallenden Ausgaben zu berücksichtigen, sondern auch die Folgekosten. Wartung, Reparaturen, Austausch von Geräten, Software-Updates und ähnliches erzeugen nicht nur häufig übersehene Kosten, sondern verursachen auch Stillstände in der Produktion. Auf der anderen Seite darf nicht vergessen werden, dass auch die Vergabe an einen Dienstleister erhebliche Ressourcen vor Ort bindet. So entstehen Aufwände durch Ausschreibungsverfahren, Definition der Anforderungen, Materialauswahl, -aushebung, -übergabe, Qualitätskontrolle der Lieferungen etc.
Bei der Abwägung Ihrer Entscheidung kann diese Checkliste nützlich sein.
Die unterschiedlichen Verfahren, Workflows, Mengen, Schwierigkeitsgrade und Erschließungstiefen bei der Zeitungsdigitalisierung ergeben ein differenziert zu betrachtendes Kostenspektrum, das sich nur bedingt verallgemeinern lässt. Die ermittelten Kostenfaktoren (vgl. Masterplan, S. 41 ff.) in Abhängigkeit der entsprechenden Rahmenbedingungen sind dabei:
- Aufgabenübergreifend
- Projektleitung und –koordination
- Vorbereitung
- Auswahl der zu digitalisierenden Inhalte und Abgleich mit der ZDBZeitschriften- datenbank
- Beschaffung der Vorlagen
- Prüfung der Vorlagenqualität und Entscheidung für eine Vorlagenart (Original vs. Mikrofilm)
- Kollationierung bzw. Prüfung der Vollständigkeit und konservatorischen Eignung
- Inhouse-Digitalisierung und/oder OCROptical Character Recognition-Bearbeitung/Tiefenerschließung: Prüfung der Eignung vorhandener Ausrüstung bzw. ggf. Beschaffung/Aufrüstung von Scannern und Software
- Vergabe an Dienstleister (Digitalisierung und/oder OCROptical Character Recognition-Bearbeitung bzw. Tiefenerschließung): Vorbereitung und Durchführung eines Vergabeverfahrens
- Vorbereitung der Materialien: ggf. Lückenschluss, konservatorische Maßnahmen
- Workflowplanung und Kostenkalkulation
- Digitalisierung
- Art des Scannereinsatzes und Komplexität des Digitalisierungsvorgangs
- Qualitätskontrolle (bei Inhouse-Digitalisierung und in Zusammenarbeit mit dem Dienstleister)
- Erschließung
- Bibliographische Erschließung
- Strukturdatenerschließung
- OCROptical Character Recognition (Antiqua, Fraktur)
- Layouterkennung / Artikelseparierung
- Bereitstellung
- Einbindung in Präsentationsoberfläche / DFG-Viewer, ggf. mit Einrichtung entsprechender Schnittstellen
- Archivierung
- Herstellung persistenter Adressierbarkeit
- Datensicherung / Langzeitarchivierung
Der Medientyp Zeitung zeichnet sich durch eine ausgeprägte Heterogenität in Bezug auf die physische und strukturelle Beschaffenheit der Vorlagen aus. Für die konkrete Planung von Zeitungsdigitalisierungsprojekten wird empfohlen, nach der Bestandsprüfung das zu wählende Digitalisierungsverfahren abzuleiten und mittels Marktsichtungen (z.B. Scanner; Dienstleister), aktualisierten Informationen (z.B. OCROptical Character Recognition-Lizenzkosten) sowie Stichproben (v.a. zur Ermittlung des Personalbedarfs für Erfassung, Qualitätskontrolle etc.) den Kostenrahmen des Projektes anhand des entsprechenden Mengengerüstes zu kalkulieren.
Detailliertere Informationen zu den im Rahmen des Pilotprojekts ermittelten Kostenkorridoren lassen sich im Masterplan (S. 44) finden.
Vollständigkeit sollte ein wichtiges Ziel jedes Digitalisierungsprojekts sein. Damit kann einerseits die Vollständigkeit aller Ausgaben eines Zeitungstitels gemeint sein. Andererseits wird, insbesondere bei größeren, langlebigen Zeitungsunternehmungen, lediglich die Vollständigkeit eines festzusetzenden Erscheinungszeitraums anzustreben sein. Im Idealfall enthalten die erzeugten Digitalisate des gewählten Titels oder Zeitraums jede bekannte gedruckte Seite, deren Existenz bspw. durch durchgehende Seiten- oder Ausgabenzählung bekannt ist oder angenommen werden darf (vgl. Masterplan, S. 27 f.).
Vor Beginn der Digitalisierung sollte deshalb die Vollständigkeit der zu digitalisierenden Zeitungen geprüft werden. Werden Lücken im eigenen Bestand identifiziert, können fehlende Bestandsteile, sofern in anderen Einrichtungen vorhanden, über entsprechende Recherchen in der ZDBZeitschriften- datenbank gefunden werden. Eine eigens für einen einrichtungsübergreifenden Bestandsvergleich eingerichtete Visualisierung bietet einen schnellen und präzisen Überblick. Im Fall der Digitalisierung vom Mikrofilm prüfen Sie zusätzlich die im Mikrofilmarchiv der deutschsprachigen Presse e.V. und im EROMM-Register nachgewiesenen Bestände.
Die Zeitschriftendatenbank (ZDB) ist das wichtigste Erfassungs- und Nachweisinstrument für Zeitschriften, Zeitungen und andere Periodika in Deutschland und Österreich und wurde im Rahmen des Projekts zum wissenschaftsfreundlichen Nachweis- und Steuerungsinstrument weiterentwickelt (vgl. Masterplan, S. 11 ff.). Es eröffnet den Zugang zu den Beständen von mehr als 4.000 Kultur- und Wissenschaftseinrichtungen.
Bitte beachten Sie, dass die ZDBZeitschriften- datenbank keine Präsentationsumgebung für Bilddateien oder Volltexte ist.
Im Kontext von Zeitungsdigitalisierungsprojekten in Deutschland erfüllt die ZDBZeitschriften- datenbank mehrere wichtige Funktionen:
- als Rechercheinstrument zur Klärung der Bestandslage und zur Identifizierung möglicher Partnereinrichtungen im Fall von existierenden Bestandslücken in der digitalisierenden Einrichtung
- als Ort der Bekanntmachung geplanter Digitalisierungen zur Vermeidung von Doppelarbeit
- als Ort der Katalogisierung der digitalisierten Zeitungen
- als Instrument der verstärkten Sichtbarmachung und Benutzerzuführung zu den digitalen Sammlungen der digitalisierenden Einrichtungen
- als übergreifendes Rechercheinstrument mit zahlreichen modernen Such-, Stöber- und Visualisierungsfunktionen für Endnutzer
- als Datenprovider bei späteren Portalisierungen digitaler Zeitungsbestände etwa in der Deutschen Digitalen Bibliothek oder in der Europeana.
Die jeweiligen Funktionen der ZDBZeitschriften- datenbank werden an den entsprechenden Textstellen dieses Wegweisers sowie umfänglich im Masterplan ab S. 55 erläutert.