Hallo Sebastian,
uiuiui, das ist ja ein ziemlich niederschmetterndes
Urteil. Aber du hast natürlich recht.
Not your fault. Ich halte einen METS Validator nicht fuer so wirklich einfach.
Allerdings habe ich auch nicht daran gedacht, bei so
grundlegenden Dingen wie der Schema-Referenzierung und den Namespaces mal nachzuhaken,
weil ich das für XML-Grundwissen hielt, das auch ein nicht METS-affiner Entwickler
beherrschen sollte.
Nein, Nein. Ich habe auch hier von Dienstleistern schon METS Dateien erhalten, die nicht
validiert haben. Es ist a) anscheinend zu viel verlangt mal auf nen Knopf zum validieren
zu druecken und b) haben einige XML-Parser/Editor anscheinend noch Probleme beim
validieren von XML Dateien, die Namespaces mischen.
Die Version von XML-Spy, die wir hier einsetzen validiert eine METS Datei, auch wenn die
extension schemas nicht validieren. Es wird kein Fehler festgestellt. Natuerlich sind den
entsprechenden namespaces auch xml schema zugeordnet.
Oxygene dagegen macht das besser.
Besser man trifft weniger Annahmen was XML Erfahrung bei den Entwicklern angeht.
Naja, der Entwicklung lagen die METS/MODS-Profile und
-Dokumentationen zugrunde. Darin sind ja eigentlich sämtliche Pflichtfelder, deren
Beziehungen und möglichen Belegungen klar erläutert. In sofern hat meines Erachtens
eigentlich nur die Festlegung gefehlt, was als Error, Warning bzw. Hint zu behandeln ist
(wobei auch das implizit gegeben ist: Pflichtelemente erzeugen Errors, optionale Felder
Warnings und Empfehlungen Hints - aber da ist eine differenziertere Betrachtung zweifellos
sinnvoll).
Das Problem beim validieren ist, dass man mehr ueber METS wissen muss. Das Profile
beschreibt ja, was erlaubt ist bzw. vorhanden sein muss. Zum validieren muss aber auch
wissen, was NICHT erlaubt ist. Das steht so nicht unbedingt immer explizit im Profil.
Bspw. die Tatsache, dass DMDID auch immer auf dmdSec zeigen sollten.
Auch muessen die Abhaengigkeiten klar sein. Die sind nicht immer so klar im Profil
herausgearbeitet - zumal wir hier ja auch noch zwei Profile haben.
Bestimmte Metadaten sind ebend gerade vom Strukturtyp abhaengig. Teilweise ist sogar der
Aufbau der METS-Datei vom obersten logischen Strukturtyp abhaengig: Zeitschriften und
Mehrbaendige Werke koennen bspw. <mptr> Elemente haben. Seiten aber bspw. nicht,
obwohl formal natuerlich alles ein <div> Element ist.
Der Viewer mag da zwar sehr tolerant sein, jedoch bspw. schon bei einer PDF-Generierung
bei dem die Inhalte fuer die PDF-Metadatenfelder aus unterschiedlichen MODS-Elementen
eines Strukturtyps zusammengesucht und gemergt werden muessen kann dies von Bedeutung
sein.
Ein Manko war sicher, dass wir dem Entwickler nur sehr
begrenzt Beispieldateien zur Verfügung stellen konnten. Wir produzieren ja selbst noch
nicht nativ METS, sondern konvertieren unser internes Format on the fly in sehr
rudimentäres METS (ohne Strukturdaten, ohne Download-Verknüpfungen, etc.), bevor es an den
DFG-Viewer geht.
Ich denke, mehr Beispiele wuerden das Verstaendnis ders Entwicklers foerdern. Ich frage
mich gerade, Stefan Funk nicht zwei Beispiel an die XML-Version des Profils gehangen
hatte.... Ist die eigentlich auch irgendwo downloadbar?
Ein formelles Requirement-Dokument fuer den Entwickler waere vermutlich trotzdem
praktisch.
Vielleicht können wir über die Technik-Liste ja mal
eine Reihe solcher Beispiele sammeln? Das wäre sicher nicht nur für Entwickler solcher
Tools interessant und hilfreich, sondern auch für Kollegen, die selbst vor der Aufgabe
stehen, ihre Digitalisate in METS zu packen.
Sehr gute Idee.
Mit deiner Erlaubnis würde ich deine Ausführungen gerne an den Entwickler weiterleiten.
Klar doch.
Ciao
Markus
**************************************************************************
Experience the British Library online at
www.bl.uk
The British Library's new interactive Annual Report and Accounts 2007/08 :
www.bl.uk/knowledge
Help the British Library conserve the world's knowledge. Adopt a Book.
www.bl.uk/adoptabook
The Library's St Pancras site is WiFi - enabled
*************************************************************************
The information contained in this e-mail is confidential and may be legally privileged. It
is intended for the addressee(s) only. If you are not the intended recipient, please
delete this e-mail and notify the postmaster(a)bl.uk : The contents of this e-mail must not
be disclosed or copied without the sender's consent.
The statements and opinions expressed in this message are those of the author and do not
necessarily reflect those of the British Library. The British Library does not take any
responsibility for the views of the author.
*************************************************************************