Lieber Sebastian,
[@Alle: Diese Antwort ist ziemlich umfänglich und detailliert. Die
unmittelbare Erwiderung auf Sebastians Fragen könnte für alle
interessant sein, unterhalb einer Abtrennung geht es in die (Un-)Tiefen
der TEI.]
Eine überarbeitete Fassung des Dokuments hängt an.
(Ich habe begonnen, die Kapitelzählung zu "normalisieren", im
Korrekturmodus habe ich dann den Überblick über die vielen Ebenen
verloren und Word ließ mich das Inhaltsverzeichnis nur einmal
aktualisieren.)
anbei finden Sie den aktuellen Entwurf des schon
länger angekündigten TEI-Anwendungsprofils für mittelalterliche Handschriften. Es stellt
den Versuch dar, die aus dem MASTER-Projekt hervorgegangene Dokumentation zur Beschreibung
von Handschriften in TEI-P5 mit METS zu verheiraten, um die Stärken beider Formate
insbesondere in der Digitalisierung nutzen zu können.
es ist ein bisschen schade, dass Du dieses Dokument "im stillen
Kämmerlein" so weit fortgeschrieben hast, so dass nun die Zeit knapp ist
und Dich dabei auf einen längst veralteten Stand beziehst
(MASTER-Projekt) ohne neuere Entwicklungen zu berücksichtigen. Nicht nur
die TEI hat sich seit dem MASTER-Projekt fortentwickelt, sondern auch
die Nutzungsszenarien: Schon das ENRICH-Projekt [1] hatte die neueren
Entwicklungen in der TEI aufgegriffen und zuletzt haben wir (i.e. BSB
und HAB als deutsche Partner) im Projekt Europeana Regia [2] die
ENRICH-Entwicklungen in Hinblick auf die Datenlieferung an die Europeana
fortgeschrieben.
Unglücklicherweise habe ich im Projekt Europeana Regia bereits ein
ähnliches Dokument erstellt, in dem die Verwendung der TEI für
Handschriften ausführlich erläutert ist. (Das Dokument war zur
Projektlaufzeit nur für den internen Gebrauch bestimmt, die
abschließende Veröffentlichung müssen wir noch organisieren. Bei Bedarf
kann ich das schon mal rumschicken.)
Ausserdem hat es auch einige theoretische Klärungen in der Frage
gegeben, was der Inhalt einer TEI-Datei eigentlich ist. Dazu gleich
mehr. Zugegebenermaßen war auch ich im ersten Beispiel für den
Demonstrator in dieser Frage einem Irrtum aufgesessen, den wir
mittlerweile geklärt haben.
Bei der Erstellung des Anwendungsprofil habe ich mich
von der oben genannten Dokumentation zur Erstellung einer Handschriftenbeschreibung nach
DFG-Richtlinien [1] leiten lassen, diese mit den weitergehenden Möglichkeiten von TEI-P5
[2] kombiniert und an die Anforderungen des DFG-Viewers angepasst. Allerdings bin ich kein
Handschriftenexperte und deshalb möchte ich Sie um Ihre Unterstützung bitten. Bitte
schauen Sie sich das Profil an und geben Sie mir Rückmeldung zu Fehlern,
Änderungsvorschlägen oder auch generelle Anmerkungen z.B. zur Verständlichkeit des
Dokuments. Sie können Ihre Anmerkungen gerne im Änderungsmodus direkt im Dokument
vornehmen und mir das Dokument dann wieder zuschicken und/oder Ihre Vorschläge natürlich
auch über diese Liste offen diskutieren. Die Äußerungsfrist muss ich auf vier Wochen
begrenzen (bis 4.11.), damit das fortgeschriebene Dokument im November erneut zur
Diskussion gestellt werden kann und trotzdem genug Zeit bleibt, die technische Implemen
tierung
im DFG-Viewer bis Jahresende abzuschließen.
Die theoretische Frage, was der Gegenstand eines TEI-Dokuments sei, ist
wichtig für das Kapitel 2.1 des Anwendungsprofils.
Wir (=HAB, analoge Lösungen, allerdings nicht auf TEI-Basis, bei ManuMed
und e-codices) gehen davon aus, dass *die Handschrift* in einer
TEI-Datei beschrieben werden kann, welche die Beschreibungsdaten im
<teiHeader> enthält, per <facsimile> das Digitalisat repräsentiert und
als <text> den Volltext der Handschrift bzw. wahlweise und als ersten
Schritt die Strukturdaten aufnimmt.
Die einzelnen Beschreibungen zur Handschrift, die ihrerseits in der
Regel "historische" Dokumente und damit unveränderlich sind, werden am
Besten in separaten TEI-Dokumenten gespeichert. In diesem zweiten Fall
ist der Gegenstand der TEI-Datei nicht die Handschrift, sondern "der
Katalog" wie er z.B. gedruckt vorliegt.
Einmal sind also die Beschreibungen Metadaten (Fall 1: <msDesc>
innerhalb von <sourceDesc>), das zweite Mal sind sie Daten (Volltext =
<msDesc> innerhalb von <text>).
*Keinesfalls* aber können die Angaben über die
Handschriftenbeschreibungen wie von Dir vorgeschlagen in den Elementen
2.1.1 bis 2.1.5 untergebracht und die Handschrift *gleichzeitig* in
<sourceDesc>/<msDesc> beschrieben werden. Dies wäre eine Verletzung des
Paradigmas "entweder Handschrift oder Katalog".
Da ich davon ausgehe, dass der DFG-Viewer eher dazu gedacht ist (sein
sollte?), *die Handschrift selbst* zu (re)präsentieren, müssten die
Felder genau entgegengesetzt definiert werden als von Dir vorgeschlagen,
also z.B. der Autor der Handschrift und nicht des Katalogisats.
[Sonst passiert dass, was im Demonstrator wie oben erwähnt falsch
gelaufen ist: Die Handschrift hätte dann z.B. einen Autor Heinemann, nur
weil der Katalog von ihn geschrieben worden ist. Das war natürlich falsch!]
Der Autor des Katalogisats steht in
msDesc/additional/adminInfo/recordHist/source.
Wichtig allgemein zu diskutieren wäre mir noch Folgendes: Du erwähnst
das Vorhandensein des METS/MODS-Profils, welches anstelle des
vorliegenden verwendet werden könnte. Hier wäre es dem Material
unbedingt angemessen, wenn wir auf diesen Hinweis verzichten würden,
weil die Anwendung von MODS dazu verleiten mag, die Daten von
vorneherein in nicht-sachdienlicher Form zu speichern und damit den
Austausch erschweren.
==========
Weitere Details, die noch nicht in das Dokument eingearbeitet wurden:
- Die einzelnen Elemente werden nicht in "modularisierter" Form
besprochen, d.h. die Aufzählung ist manchmal redundant (tei:p) und
manchmal missverständlich (tei:summary). Könnte man nicht dem
TEI-Vorbild folgen, die Elemente grundsätzlich in alphabetischer
Reihenfolge aufzulisten und bei Oberelementen anzugeben, welche darin
vorkommen können?
- Ich finde auch den Sprachmix unglücklich. Zu allen TEI-Beschreibungen
der genannten Elemente müsste es bei der TEI auch eine Übersetzung
geben, wieso nicht diese verwenden, sondern das Englische? Würde nicht
auch ein Link auf die TEI-Seite ausreichen bzw. nützlich sein?
- Im Profil wird die Dokumentation der verwendeten Sprache nirgends
erwähnt. In der TEI ist @xml:lang ein globales Attribut, wovon häufig
Gebrauch gemacht wird. Insbesondere in internationalen Kontexten ist
dies wichtig. Deshalb sollte grundsätzlich möglichst frühzeitig im
XML-Dokument (=root), insbesondere aber auch an bestimmten definierten
Stellen Gebrauch davon gemacht werden: bei <msDesc>, <title>, und bei
allen Zitat-artigen Elementen.
- Im Profil wird die Referenzierung auf Normdaten nicht thematisiert,
vor allem bei Autoren, Texten, Orten etc. ist das aber von zentraler
Bedeutung für die Interoperabilität der Daten. Das sollte unbedingt rein.
- Das <publicationStmt> enthält bei Dir keinen Verweis auf die
Rechtedeklaration. Den jüngsten Erfahrungen zufolge sind diese Angaben
essentiell wichtig für den Datenaustausch und daher an dieser Stelle
unabkömmlich, damit die Angaben in der Handschriftenbeschreibung
verfügbar sind. Diese können nicht sinnvoll in die METS-Datei
ausgelagert werden. (Vgl. dazu meine Kommentare im Dokument zum Element
tei:availability)
- Bei tei:date verzichtest Du auf @type, welches wir für die
Differenzierung verwenden, wann das Dokument veröffentlicht bzw. wann
die Handschrift digitalisiert worden ist.
- Bei tei:idno (wir verwenden lokal <tei:ptr>) fehlt mir der type, mit
dem man das anzuzeigende Thumbnail spezifizieren kann. Im Projekt
Europeana Regia verwenden wir <ptr type="thumbnailForPresentations">.
- Kann man nicht an fast allen Stellen auf die alternative Kodierung
mittels tei:p verzichten? Wenn das nicht gewünscht ist, brauchen wir es
nicht unbedingt zu erwähnen.
- Ist bei tei:collection nicht auch noch @type angebracht, um
gegebenenfalls die Art der Sammlungsbezeichnung zu dokumentieren? Man
möchte ja gegebenenfalls nicht alle Angaben oder die vorhandenen n einer
bestimmten Reihenfolge ausgeben?
- Für tei:head siehst Du vor, dass "Die Angabe der nach DFG-Richtlinien
gebildeten Schlagzeile im Unterelement tei:note[@type="caption"] [...]
verpflichtend" sein soll. Wenn wir aber das Profil zugleich als
Einführung und Richtlinie in die Katalogisierung bestimmter
Basiskategorien (in Europeana Regia: "concise metadata") verstehen, dann
zwingen wir den Katalogisierer, die Angaben doppelt zu machen, da z.B.
die Angaben zu Entstehungsort und -zeit separat in recherchierbaren
Felder angegeben werden *müssen*! Ich hatte hier bisher immer die
Alternative Kodierung in Einzelfeldern vorgesehen und so arbeiten auch
die Skripte.
- In 2.2.2.2.9 gehört tei:textLang nach vorne, gemäß der Reihung in
msContents! (2.2.2.2.9.3 statt 5)
- In den Elementen handNote bzw. scriptNote sollte die Benutzung der
Attribute scribe/scribeRef bzw. script/scriptRef anempfohlen werden.
==========
Wichtig für die Etablierung des Anwendungsprofils wäre es ausserdem zu
berücksichtigen, dass die Handschriftenzentren die Aufgabe haben, die
Richtlinien Handschriftenkatalogisierung vor dem Hintergrund der
Digitalisierung fortzuschreiben.
Beste Grüße,
Torsten
[1]
http://enrich.manuscriptorium.com, besonders:
http://tei.oucs.ox.ac.uk/ENRICH/ODD/WP3_deliv_1.xml und
http://projects.oucs.ox.ac.uk/ENRICH/Deliverables/referenceManual_en.html
[2]
http://www.europeanaregia.eu, Materialien zur Nutzung der TEI unter
http://diglib.hab.de/rules/schema/ER/current/euroepana-regia.xml
--
Torsten Schassan
Digitale Editionen
Abteilung Handschriften und Sondersammlungen
Herzog August Bibliothek, Postfach 1364, D-38299 Wolfenbuettel
Tel.: +49-5331-808-130 (Fax -165), schassan {at} hab.de
*neu: Handschriftendatenbank*
http://diglib.hab.de/?db=mss
http://www.hab.de/forschung/projekte/europeana-regia.htm