Hallo Sebastian,
das wird zum Teil bereits getan. XML-Dokumente, die
nicht wohlgeformt sind oder kein METS-Root-Element besitzen, werden gar nicht weiter
validiert, sondern gleich als ungültig zurückgewiesen. Nur wenn das Dokument grundsätzlich
METS-XML ist, wird eingehender geprüft. So gesehen gibt es also bereits eine
Unterscheidung zwischen "Error" und "Warnung".
Hm, nein das was du beschreibst stellt eine andere Ebene da. Im Prinzip hast du doch
folgendes Vorgehen:
1) Validierung der XML Serialisierung anhand eines oder mehrerer Schema(s).
2) Ueberpruefung des DOM-Trees (oder eines anderen Objektbaums), und Validierung der METS
Semantik:
(a) zeigen <fptr> auf Dateien
(b) zeigen DMDIDs auf dmdSec
etc...
3) Ueberpruefung des spezifischen Datenmodells
(a) sind zwei StructMaps vorhanden
(b) sind Verlinkungen entsprechend gesetzt
(c) sind entsprechende Attributwerte richtig gesetzt (ORDER und ORDERLABEL bspw.)
4) Ueberpruefung der Extension Schemas
Also Ueberpruefung der deskriptiven Metadaten etc.
In all diesen Bereichen kann es "Errors", "Warnings" und
"Hints" geben. Beispiel:
1) Error: wenn Dokument nicht wellformed und nicht validierbar
Hint: wenn anderer Prefix als "mets" wird benutzt. <blafasel:mets>
wurde zu einem Hint (ggfs. auch zu einer Warning) fuehren, auch wenn der namespace
entsprechend fuer den Prefix deklariert ist
Das laesst sich beispielhaft sicherlich fortsetzen...
Wobei ich mich frage, was der Validator nun eigentlich wirklich ueberprueft. Fehler kann
es ja schliesslich viele geben...
Des weiterren
mal die Frage:
Haben wir ein Set an fehlerhaften METS Dokumenten, mit denen wir den
Validator testen koennen?
Woher wissen wir sonst, dass der Validator auch alle Fehler
entsprechend meldet?
Das ist eine berechtigte Frage. Anbei deshalb einige fehlerhafte Beispiele, >die der
Entwickler des Validators uns zu Testzwecken mitgeliefert hat.
Werde mir die Beispiel mal anschauen. Allerdings frage ich mich, ob es eine Dokumentation
gibt, was der Validator alles validiert und auf welchen Erfahrungen eine solche Liste
basiert.
Ciao
Markus
**************************************************************************
Experience the British Library online at
www.bl.uk
The British Library's new interactive Annual Report and Accounts 2007/08 :
www.bl.uk/knowledge
Help the British Library conserve the world's knowledge. Adopt a Book.
www.bl.uk/adoptabook
The Library's St Pancras site is WiFi - enabled
*************************************************************************
The information contained in this e-mail is confidential and may be legally privileged. It
is intended for the addressee(s) only. If you are not the intended recipient, please
delete this e-mail and notify the postmaster(a)bl.uk : The contents of this e-mail must not
be disclosed or copied without the sender's consent.
The statements and opinions expressed in this message are those of the author and do not
necessarily reflect those of the British Library. The British Library does not take any
responsibility for the views of the author.
*************************************************************************