Re: [DFG-Viewer] Strukturdaten für Zeitungen?

25 Feb 2010

Lieber Herr Heiligenhaus,
ich hatte ja absichtlich am Anfang meiner Mail gewarnt, dass ich etwas ins Träumen geraten
würde. :)
...
  Mit RAK-WB und
 MAB2 kommen Sie halt bei Handschriften und Autographen nicht sonderlich
 weit. Dafür haben Sie auch keine komplexen Prozesse wie Erwerbung,
 Ausleihe usw. in diesen Bereichen zu lösen. Folglich macht es Sinn, für
 spezielle Medientypen ideale Erschließungswerkzeuge bereitzustellen.
 Der Traum, alles passe in einen Katalog, endet m.E. im Alptraum, daß
 wir darin nichts relevantes mehr finden, weil wir alle Differenzen
 plattgebügelt haben. 
Ich wage mal die ketzerische Behauptung, dass eine Handschrift sich von einer Monographie
gar nicht so sehr unterscheidet, wenn man sie nicht mit den Augen eines Bibliothekars
betrachtet. Das ist aber hier gar nicht die entscheidende Frage. Die Frage ist vielmehr:
unterscheidet sich eine *digitalisierte* Handschrift so sehr von einem *digitalisierten*
Druck? Nachdem ich nun die Vorschläge von Herr Schulze zur Kodierung von digitalisierten
Zeitungen, von Herr Schaßan zur Kodierung von digitalisierten Handschriften und unsere
eigenen Vorschläge zur Kodierung von digitalisierten Drucken und Zeitschriften kenne,
behaupte ich guten Gewissens: so groß sind die Unterschiede gar nicht, als dass man sie
nicht in ein einziges Format bringen könnte, ohne Granularität einzubüßen. Natürlich
müsste ein geeignetes Format geschaffen werden und zwar nicht durch Generalisierung und
Vereinfachung (dann hätten wir am Ende DublinCore), sondern durch Vereinheitlichung und
Aggregation.
Meines Erachtens machen wir nämlich den Fehler, unsere Digitalisate genauso behandeln zu
wollen, wie wir die analogen Vorlagen behandeln. Und das wird dem (neuen) Medium nicht
gerecht.
...
  "physisch" bedeutet z.B. nicht, daß ein Buch
physisch aus Einzelseiten
 bestünde. Üblicherweise bestehen Bücher aus Bögen von vier Druckseiten,
 die z.B. fadengeheftet sind. Oder von zwei Druckseiten, die in einen
 Einband geklebt werden. Über das alles wollen wir mit unserem Modell
 keine Aussage machen. Unser Ziel ist doch vielmehr, ein einheitliches
 Schema vorzugeben für die Digitalisierung, Strukturierung und
 Präsentation digitalisierter Medien, damit diese für einen Nutzer
 einheitlich nutzbar sind im Netz. 
Richtig, und dabei würde ich sogar soweit gehen, nicht nur Bögen und Druckseiten zu
vernachlässigen, weil das Digitalisat nunmal nur noch aus Dateien besteht, sondern auch zu
vernachlässigen, dass z.B. der "Titel" einer Handschrift eigentlich nicht
"Titel" heißt. Letztlich ist es doch dasselbe, nämlich die wichtigste Form der
verbalen Adressierung des vorliegenden Werks. Oder mit anderen Worten: so wie ich nicht
die tatsächliche physische Struktur der Vorlage beschreibe, sondern im Grunde die Struktur
des Digitalisats, so sollte ich mich auch in allen anderen Belangen auf das Digitalisat
beziehen und lediglich eine Referenz auf die Vorlage als Quelle angeben. Was es zur
Vorlage zu wissen gibt, steht schließlich schon im Katalog, dazu muss ich mir nicht das
Digitalisat anschauen.
Die grundsätzliche Frage ist: warum unterscheiden wir überhaupt zwischen "Digitalisat
einer Handschrift" und "Digitalisat einer Monographie" und nicht zwischen
"Handschrift", "Monographie" und "Digitalisat"? Das tun wir
doch nur deshalb, weil wir das Digitalisat einer Handschrift genauso behandeln wollen wie
eine Handschrift und das Digitalisat einer Monographie so wie eine Monographie. Wenn
jemand eine Monographie handschriftlich abschreibt, wird das Ergebnis aber doch auch als
Handschrift behandelt und nicht als Monographie. Warum gilt das nicht für die
Digitalisierung? Warum nicht ein Digitalisat als eigenständigen Medientyp betrachten,
dessen Erschließung sich natürlich an der Erschließung der Vorlage orientieren sollte, der
aber flexibel genug ist, um Vorlagen jeden Typs abbilden zu können?
Das ist natürlich eine sehr weitreichende Forderung, aber langfristig sehe ich das als das
Ziel: Es zeichnet sich ja bereits ab, dass die Struktur eines Digitalisats unabhängig vom
Typ der Vorlage weitgehend einheitlich in METS abgebildet werden wird. (Die
Handschriften-Experten diskutieren ein METS/TEI-Format, bei den Nachlässen ist METS/EAD
als eine Alternative im Gespräch.) Etwas ähnliches müsste doch auch für die deskriptiven
Metadaten zu erreichen sein. Statt eines gemeinsamen Strukturdatensets könnte man doch
auch ein gemeinsames Metadatenset über verschiedene Medientypen hinweg erstellen. Das Ziel
muss ja nicht ein weitgehend generalisiertes und auf ein Dutzend Metadaten eingedampftes
Set sein (wie etwa DublinCore), sondern darf ruhig etwas umfangreicher ausfallen, um eben
nicht "alle Differenzen plattzubügeln". Ich bin mir aber sicher, dass (genau wie
beim Strukturdatenset) bei näherer Betrachtung plötzlich erheblich mehr Gemeinsamkeiten
ans Tageslicht kämen, als man vorher erwartet hätte. :)
Ich sehe einfach die Notwendigkeit der Unterscheidung zwischen verschiedenen Vorlagentypen
in der digitalen Welt nicht mehr. In der analogen Welt hat das alles seine Berechtigung,
weil es dort keine Suchmaschinen "über alles" gibt und ich mich deshalb jedem
Medium individuell nähern muss, um zum Ziel zu kommen. Letztlich hat die ganze
Katalogisierung doch nur das Ziel, Unmengen analoger Medien in irgendeiner Form zu
klassifizieren, damit sie findbar sind. In der digitalen Welt ist das aber doch viel
einfacher.
Um beim aktuellen Fall der Zeitung zu bleiben: in der analogen Welt muss ich die Signatur
der Zeitung kennen, um überhaupt nur eine Chance zu haben, das zu finden was ich suche.
Dort gibt es keinen anderen Weg zu der gesuchten Ausgabe zu kommen, als über diese
Information - entsprechend müssen die Signatur im Katalog stehen und die Ausgaben im Regal
ordentlich sortiert sein. In der digitalen Welt habe ich dagegen ein Recherchesystem, dass
sämtliche Struktur- und Metadaten der digitalisierten Zeitung indiziert hat. Dort tippe
ich einfach das Datum ein und bekomme alle Ausgaben des entsprechenden Tages
zurückgeliefert. Dazu muss ich aber nicht die analoge Welt nachbilden, in dem ich die
Sortierung nach Jahr, Monat, Tag in die Strukturdaten schreibe, sondern es reicht, wenn
ich den Erscheinungstag jeder Ausgabe jeweils in die MODS-Metadaten der METS-Datei eben
dieser Ausgabe schreibe.
Das Problem ist also nicht, dass das Datenformat das "analoge Vorgehen" nicht
abbildet, sondern dass es bislang kein Recherchesystem gibt, dass das "digitale
Vorgehen" umsetzt - obwohl die Voraussetzungen dafür gegeben sind. Das ist auch genau
die in meiner letzten Mail beschriebene Lücke: wir haben ein Katalogsystem für die analoge
Welt und auf der anderen Seite ein Anzeigeinstrument für die digitale Welt.  Das passt
nicht zusammen. Statt nun aber das Anzeigeinstrument in die analoge Welt zu holen, sollten
wir lieber einen Katalog für die digitale Welt schaffen.
Viele Grüße
Sebastian Meyer
--
Sebastian Meyer
Projekt-Mitarbeiter
Sächsische Landesbibliothek -
Staats- und Universitätsbibliothek Dresden (SLUB)
01054 Dresden
Tel.: +49 351 4677-206
Fax:  +49 351 4677-711
http://www.slub-dresden.de/
> -----Ursprüngliche Nachricht-----
> Von: dv-technik-bounces(a)dfg-viewer.de [mailto:dv-technik-bounces@dfg-
> viewer.de] Im Auftrag von Kay Heiligenhaus
> Gesendet: Donnerstag, 25. Februar 2010 13:30
> An: dv-technik(a)dfg-viewer.de; technik(a)dfg-viewer.de
> Betreff: Re: [DFG-Viewer] Strukturdaten für Zeitungen?
>
> Lieber Herr Meyer,
>
> > Wenn das ernsthaft betrachtet keine schlechte Überlegung ist, warum
> > betrachten wir es dann nicht ernsthaft? :) Vielleicht brauchen wir
> auch nicht
> > Strukturdaten und Volltexte in den Katalogen der analogen Welt,
> sondern
> > analoge Medien in den Katalogen der digitalen Welt? Aktuell gibt es
> zig
> > Verbünde, unzählige Lokalsysteme und etliche Spezialverzeichnisse für
> > diverse Medientypen - alles mit der Begründung, dass die jeweils
> anderen
> > Kataloge den Bedürfnissen des Medientyps nicht gerecht werden.
>
> Ich glaube, das kann man nicht alles in einen Topf schmeißen: Daß es
> verschiedene Verbund- und Lokalsysteme gibt, hat sehr vielfältige
> Gründe. Nicht wenige davon sind einfach Ergebnis gewachsener Strukturen
> (sein Bibliothekssystem wechselt man halt nicht täglich wie das Hemd).
> Und im Kern sind es eben Ergebnisse von Kauf- oder
> Entwicklungsentscheidungen über viele Jahre hinweg. So wie es Mercedes,
> Audi, Volkswagen, Land Rover, Fiat, ... gibt, so gibt es eben Aleph,
> PICA, SISIS, Allegro, ... Dann gibt es eben die konkreten Fragen der
> Erschließung und Darstellung bestimmter Medientypen. Mit RAK-WB und
> MAB2 kommen Sie halt bei Handschriften und Autographen nicht sonderlich
> weit. Dafür haben Sie auch keine komplexen Prozesse wie Erwerbung,
> Ausleihe usw. in diesen Bereichen zu lösen. Folglich macht es Sinn, für
> spezielle Medientypen ideale Erschließungswerkzeuge bereitzustellen.
> Der Traum, alles passe in einen Katalog, endet m.E. im Alptraum, daß
> wir darin nichts relevantes mehr finden, weil wir alle Differenzen
> plattgebügelt haben.
>
> > Nun werden offensichtlich alle Kataloge den Bedürfnissen der
> Digitalisate nicht
> > gerecht, aber plötzlich sollen sich nicht mehr die Kataloge, sondern
> die
> > Digitalisate anpassen...
>
> Da verstehe ich Ihren Punkt noch nicht: Mit dem METS-Profil verfolgen
> wir doch den Anspruch, ein komplexes Dokumentenmodell zu etablieren für
> die Beschreibung digitalisierter Objekte. Unsere Bezugsgröße ist dabei
> das Katalogisat der Einheit, über die wir da Aussagen machen (Aussagen
> der Art: Das ist deine "physische Form", das ist deine "logische
Form",
> in dieser Relation stehen diese beiden Formen zueinander usw.). Man
> darf sich hier aber von den Begrifflichkeiten nicht verwirren lassen:
...
  "physisch" bedeutet z.B. nicht, daß ein Buch
physisch aus Einzelseiten
 bestünde. Üblicherweise bestehen Bücher aus Bögen von vier Druckseiten,
 die z.B. fadengeheftet sind. Oder von zwei Druckseiten, die in einen
 Einband geklebt werden. Über das alles wollen wir mit unserem Modell
 keine Aussage machen. Unser Ziel ist doch vielmehr, ein einheitliches
 Schema vorzugeben für die Digitalisierung, Strukturierung und
 Präsentation digitalisierter Medien, damit diese für einen Nutzer
 einheitlich nutzbar sind im Netz. >
> > Ich frage mich: wenn man es nicht einmal schafft, alle analogen
> Medien
> > einheitlich in einem einzigen Katalog zu verzeichnen, warum müssen
> dann
> > die Digitalisate zwingend in den OPAC, den Verbund oder die ZDB?
> Natürlich
> > ist das aus Nutzersicht besser als noch einen neuen Katalog neben das
> > vorhandene Dutzend zu stellen. Aber dem Nutzer ist auch nicht
> geholfen,
> > wenn er dann im Katalog lediglich einen Eintrag für die gesamte
> Zeitung
> > findet und sich anschließend mühsam durch etliche Navigationsebenen
> > hangeln muss, bevor er einen konkreten Artikel auf dem Bildschirm
> hat. Und
> > dabei muss immer vorausgesetzt werden, dass er bereits genau weiß,
> > welche Ausgabe welchen Datums von welcher Zeitung er überhaupt
> > betrachten will - andernfalls hilft ihm der Katalog und Ihre
> Strukturierung
> > nämlich auch nicht weiter.
>
> Hm. Bei Zeitschriften läuft das eigentlich genau so. Ich habe einem
> bibliographischen Nachweis (zumeist aus einer wissenschaftlichen
> Publikation), der mit sagt: Du findest mich in "Zeitschrift für
> angewandte Typologie, Jg. 13 (1998), H. 2, S. 19-29". Mit dieser
> Information marschiere ich in die Bibliothek. Suche im OPAC. Bestelle
> eine Bindeinheit mit einer konkreten Signatur und lege das Teil
> anschließend auf den Kopierer. Genau das möchte ich auch in einer
> digitalen Bibliothek machen können. Nur heißt das hier: Suche in der
> ZDB (oder im OPAC). Klick auf den Link zum Viewer. Navigation zum
> entsprechenden Artikel. Download eines PDFs oder Lesen am Bildschirm.
> Es ist schlichtweg utopisch zu glauben, wir könnten alle historischen
> Zeitschriften tatsächlich irgendwann auf unselbständiger Ebene (also
> Artikelebene) katalogisiert und digitalisiert haben. Dann entfiele
> tatsächlich die "mühsame" Navigation zur Fundstelle.
>
> Bei Zeitungen ist es m.E. noch was anderes. Da interessiert mich
> vielleicht, was an meinem Geburtstag so in der Welt passiert ist. Oder
> wie die deutschen Tageszeitungen die Kriegsausbrüche 1914 und 1939
> kommentiert haben. Was schrieb man über die Gründung des Kaiserreichs?
> Wie wurde der Einzug Napoleons in Berlin dargestellt? Zeitungen
> zeichnen sich schlichtweg durch ihren aktuellen Bezug zum Zeitgeschehen
> aus. Das gibt ihnen m.E. eben auch ihre Struktur. Es geht hier um
> Jahre, Monate, Tage. Darin strukturiert sich nämlich das Zeitgeschehen,
> über das berichtet wird.
>
> > In sofern sehe ich die Perspektive gar nicht so unrealistisch, dass
> ZVDD u.ä.
> > Systeme künftig tatsächlich die Rolle von primären Katalogsystemen
> spielen
> > werden - nur eben nicht für analoge Medien, sondern für Digitalisate.
> Einfach
> > deshalb, weil sie dem Nutzer all die Möglichkeiten anbieten, die wir
> im
> > Datenformat so mühsam angelegt haben: Volltexte, Strukturdaten,
> > Beziehungen zwischen den Werken, etc.
>
> Sie vergessen dabei schlicht, daß moderne Bibliothekssysteme
> integrierte Systeme sind. Der OPAC ist dabei nur eine Funktionalität
> unter vielen.
>
> > Wie eine solche Standardnavigation aussieht, sollte aber nicht im
> > Datenformat festgeschrieben werden, sondern dem Präsentationssystem
> > überlassen werden (was nicht heißt, dass wir dazu nicht Empfehlungen
> > formulieren können). Das Datenformat muss nur sicherstellen, dass
> alle
> > nötigen Informationen vorhanden sind.
>
> Ich sehe nicht, daß wir durch die Definition von weiteren Strukturdaten
> für einen Publikationstyp, der offensichtlich anders aufgebaut ist als
> diejenigen, mit denen wir uns bislang intensiver beschäftigt haben,
> mehr oder andere Festlegungen gemacht werden, als wir das bisher getan
> haben.
>
> > Es besteht offensichtlich eine Lücke zwischen einer Zeitung (die im
> Katalog
> > nachgewiesen ist) und ihren Ausgaben (die problemlos im Viewer
> dargestellt
> > werden können). Diese Lücke muss mit irgendeiner geeigneten Form von
> > Navigation gefüllt werden, die es dem Nutzer erlaubt, vom Katalogisat
> der
> > Zeitung zur Anzeige einer Ausgabe dieser Zeitung zu gelangen. Diese
> Lücke
> > im Retrievalsystem ist aber genau das: ein fehlendes Feature der
> Systeme
> > und keine Unzulänglichkeit des Formats. Ich sehe das wie Herr Enders:
> mit
> > den aktuellen Mitteln kann eine Zeitung bereits modelliert werden,
> dazu
> > braucht es keine Erweiterung des Datenformats. Was erweitert werden
> > muss, sind die Möglichkeiten der Recherche- und/oder
> > Präsentationssysteme, um mit digitalisierten Zeitungen vernünftig
> umgehen
> > zu können.
>
> Ich verstehe auf eine bestimmte Art die Diskussion nicht. Durch das
> generalisierte Navigationsmodell in _beliebigen_ Hierarchien haben wir
> im Viewer alle Voraussetzungen geschaffen, um auch das hier diskutierte
> Problem lösen zu können. Es geht hier doch schlicht um die Frage:
> Sollen wir weitere Strukturdaten ergänzen, um Zeitungen mit ihren
> Spezifika besser darstellen zu können? Es geht nicht darum, daß wir
> irgendwas am Viewer erweitern müßten, um dieses Ziel zu erreichen.
> Technisch ergeben sich hier keinerlei Anforderungen.
>
> > Vielleicht sollten wir tatsächlich nicht 20 Jahre warten, sondern es
> selbst in
> > die Hand nehmen?
> > Gerade weil wir uns bei der Spezifizierung des Datenformats an der
> > herrschenden Katalogisierungspraxis orientiert haben, könnten wir
> jetzt
> > einen Katalog schaffen, der allen Bedürfnissen der Digitalisate
> gerecht wird
> > und zugleich auch analoge Medien verzeichnen kann. Gleichzeitig
> bemühen
> > wir uns bei der Spezifizierung von Datenformaten für digitalisierte
> > Handschriften, Nachlässe und Zeitungen aktuell um größtmögliche
> > Kompatibilität zu den digitalisierten Drucken, so dass wir sogar die
> > fürchterlich nutzer-unfreundliche Trennung der Medientypen aufheben
> > könnten. Der Bedarf ist offensichtlich da, wie man an zahlreichen
> Meta-
> > Katalogen sieht, und die Voraussetzungen sind so günstig wie nie,
> weil genau
> > jetzt für viele Medientypen die Grundsteine zur Massendigitalisierung
> gelegt
> > werden (und damit entscheidende Katalogisierungs- und Formatfragen
> > diskutiert werden). Wenn diese Entscheidungen erstmal wieder
> zugunsten
> > irgendwelcher medientypologischer Insellösungen getroffen wurden,
> > können wir wirklich mindestens 20 Jahre warten, bevor da eventuell
> wieder
> > was passiert. :)
>
> Ich bin da ganz offensichtlich deutlich skeptischer, als Sie es sind.
> Daß es so viele spezialisierte Lösungen für unterschiedliche
> Medientypen gibt, halte ich eben nicht für das Ergebnis eines
> irrationalen Prozesses, sondern für das Ergebnis der Arbeit an
> spezifischen Problemlösungen, die den Materialitäten unserer Sammlungen
> geschuldet sind. Standards kann man nur da etablieren, wo es
> hinreichende Gemeinsamkeiten gibt. Oder eben da, wo man sich auf
> bestimmte Aspekte konzentriert. So ist z.B. die Darstellung von
> Metadaten im Viewer m.E. nur deshalb in Ordnung, wie wir sie sehr
> reduziert machen, weil es den Kataloglink gibt, über den ich mich als
> Nutzer über jeden Titel im Detail informieren kann, wenn ich das
> möchte.
>
> Ein letzter Aspekt noch: Wir hatten hier vor kurzem eine Diskussion
> über das Europeana-Datenmodell. Schaut man sich die ersten
> Importergebnisse von EuropeanLocal-D im Netz an, dann sieht man, daß
> wir das Problem der Darstellung von Zeitungen und Zeitschriften auch
> hier bekommen werden. Denn wenn wir das Problem so lösen würden, wie
> Sie es hier vorschlagen (das Nachweissystem soll die Hierarchie
> verstehen und abbilden, der Viewer dann nur noch die "Endknoten"
> darstellen können, mehr nicht), dann würde das für Europeana (und alle
> anderen Harvestingsysteme) ja analog gelten. Man käme nicht mehr von
> der "Hauptaufnahme" zum digitalisierten Gesamtobjekt, sondern eben
> immer nur in die konkreten Teilobjekte, deren Struktur im
> Nachweissystem beschrieben und navigierbar sein müßte. Die Krux dabei:
> EuropeanaLocal-D harvested die METS-Daten, die wir nach unserem Modell
> zur Verfügung stellen. Wenn sich die Informationen über das
> Gesamtobjekt aber nur aus einem noch zu schaffenden "Superkatalog"
> beziehen lassen, die Informationen über die Teilobjekte nur aus einem
> reduzierten Repository, dann könnte Europeana aktuell: gar nichts
> harvesten und gar nicht anzeigen von unserer digitalen Pracht. Bedeutet
> unterm Strich: Ihr "reduzierter Ansatz" (weg mit den Hierarchien im
> Modell) führte dazu, die Komplexität des Problems in zig weitere
> Systeme zu verlagern und nicht an einem Ort zu bündeln.
>
> Nehmen Sie als abschließendes Beispiel folgendes:
>
>   http://www.europeana.eu/portal/full-
> doc.html?uri=http://www.europeana.eu/resolve/record/09428/8911A37D3E7AF
> 6888E728A5D20F10C873352513F
>
> Das ist der Datensatz der Trierischen Chronik in der Europeana. Den
> Datensatz gibt es auch im Worldcat:
>
>   http://www.worldcat.org/title/trierische-chronik/oclc/263724874
>
> Sollen wir jetzt auch mit OCLC darüber diskutieren, daß Kataloge und
> Metakataloge digitalen Medien nicht gerecht werden, nachdem wir die
> ZDB/EZB-Verantwortlichen davon überzeugt haben?
>
> Nein, bei allem Nachdenken über Ihre Argumentation bleibe ich dabei,
> daß es m.E. sehr sinnvoll ist, wie wir es bislang angegangen sind. Und
> daß wir auf diesem Wege unser Ziel am besten erreichen: Hohe
> Sichtbarkeit digitalisierter Materialien auf Basis eines ausgesprochen
> flexiblen, aber durchaus komplexen Standardmodells.
>
> Beste Grüße,
> Kay Heiligenhaus

2026

2025

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

2008

Re: [DFG-Viewer] Strukturdaten für Zeitungen?