Lieber Herr Meyer, liebe Kollegen,
ich kann Ihrem Wunsch nach Einfachheit im Prinzip nur zustimmen. Dennoch
beunruhigen mich Probleme wie die komplexeren Daten von Frau
Federbusch. Weniger für den Viewer, mehr für ein Harvesting. Nun könnte
man zwar argumentieren, dass uns das für den Viewer nicht interssiern
muss, jedoch prejudizieren wir durch bestimmte Kodierungen
Verfahrenswege, die aus meiner Sicht "unterflexibel" sind. Ich möchte
daher noch einmal abstrakt rekapitulieren: Wir haben ein Tag für das
sozusagen Markup (=type) und ein Tag für den Content (=Label).
Der ersten Fall ist der, dass in Type bisher die XML-Form der
Strukturdatenliste, z.B. title_page, in LABEL die Umsetzung, z.B.
Titelblatt, kodiert wird. Soweit so gut; theoretisch könnte man auch
Mehrsprachigkeit auf der Basis des type-Attributes, das ja eigentlich
eine Ansetzungsform oder gleichsam Nummer ist, generieren.
Doch gibt es hier auch noch andere Kodierungsmöglichkeiten, die nicht im
engeren Konzept von Strukturdaten, wohl aber virtuellen
Inhaltsverzeichnissen bzw. -registern liegen, die ja auch dem hier
verfolgten Zweck der besseren Navigation dienen.
Z.B. wenn ich einen Personennamen (hier kommt eine bestimmte Person vor)
im Sinne eines virtuellen Personennamenregisters anzeigen möchte, wäre
analog eine Kodierung type=[PND-Nummer] Lable=Ansetzungsform zu wählen.
In type selber muss dann aber, um Äquivokationen zu vermeiden, ein
Schlüssel mitgegeben werden, z.B. type="pnd_1234567". Entsprechend wäre
es dann auch ratsam, die Strukturdatenliste - sie mag nun auch
HSS-Elemente enthalten oder nicht - mit structMD oder ählichem zu
versehen type="structMD_title_page". Wie gesagt, für die Anzeige, die
sich aus dem LABEL Attribut speist (wenn denn Mehrsprachigkeit kein
Thema ist), ist das erst einmal nebensächlich, für das Harvesting aber
zentral.
Der andere Fall ist, dass das LABEL-Attribut echten Text-Content
enthält. Hier ist das Ignorieren des type Attributs auch unter
Viewergesichtspunkten problematisch. Z.B. findet sich eine Überschrift,
type=structMD_chapter, und LABEL="Die schöne Melusine...". Da hier nur
das Label ausgegeben und nicht weiter qualifiziert wird, sieht der
Nutzer nicht, worum es sich handelt. Ist diese eine Überschrift eine
Section, ein Kapitel, ein Titelblatt, eine Beischrift zu einer
Illustration, ein Kolophon etc. Unschön wird es, wenn sich Struktur und
Inhaltsdaten mischen, also "Kapitel", capitula (in der Überschrift),
etc. In die selbe Kategorie gehört Volltext oder Teilen daraus. Will der
Viewer Voll- oder Teiltranskriptionen zu etwa Handschriften nicht mit
anzeigen, wenn sie denn vorliegen? Genau darauf zielte mein Vorschlag,
es mit FContent zu versuchen. Herr Heiligenhaus hat den Sachverhalt benannt:
"Every div node in the structural map hierarchy may be connected (via
subsidiary mptr or fptr elements) to content files which represent that
div's portion of the whole document."
aber noch nicht in diesem Sinne interpretiert.
Mit einem schnellen Hüftschuss kommen wir sicher sofort zur Ver. 2,
verbauen uns aber möglicherweise weitere Entwicklungsmöglichkeiten,
deswegen wollte ich noch einmal nackhaken, ohne jetzt sicher zu wissen,
was genau die Alternative wäre und ob wir das System nicht hypertroph
machen. Zumindest ist es nicht unproblematisch die type-label Struktur
für alle diese Aspekte verwenden zu wollen.
Ein Trffen in Dresden würde ich sehr begrüßen. Bitte aber nicht vor dem 9.3.
Viele Grüße,
Ihr
Th. Stäcker
Meyer, Sebastian schrieb:
Liebe Kollegen,
Hintergrund des Problems ist
aus meiner Sicht, daß wir aktuell _gezwungen_ sind, für jedes DIV auch
ein LABEL-Attribut zu liefern - der Viewer interessiert sich schlicht
nicht für das TYPE-Attribut. Damit gehen aber alle Möglichkeiten
verloren, die die Verwendung eines kontrollierten Vokabulars eröffnen.
Konzept war und muß aus meiner Sicht hier sein: Das TYPE-Attribut ist
verpflichtend, das LABEL-Attribut ist optional. Wenn ein LABEL
vorhanden ist, wird dies ohne Berücksichtigung des aktuellen
Sprachmodus des Viewers angezeigt. Wenn kein LABEL vorhanden ist, dann
wird TYPE ausgewertet und entsprechend unserer abgestimmten Liste unter
http://dfg-viewer.de/strukturdatenset/
in der jeweils im Viewer gewählten Sprache angezeigt. Am besten - um
das voneinander abzuheben - in eckigen Klammern. So jeweils hatte ich
den letzten Diskussionstand verstanden.
Richtig, so sollte es sein. Darauf hatten wir uns auch zuletzt geeinigt, ich habe es
lediglich noch nicht umgesetzt.
Ich würde die Sache allerdings nur ungern weiter verkomplizieren, in dem der Viewer
künftig auch noch eine Vielzahl verschiedener Strukturdatensets unterstützen soll. Das
wäre aus meiner Sicht auch nicht besonders zielführend:
Wenn auch externe Strukturdatenlisten unterstützt werden sollen, müsste erst wieder ein
Standard geschaffen werden, wie solche Listen auszusehen haben. Wir müssten uns auf Format
und Übertragungsweg einigen und auch wieder alle Eventualitäten beachten. Wie soll der
Viewer beispielsweise reagieren, wenn die Liste nicht erreichbar ist oder in einem
ungültigen Format vorliegt?
Außerdem bedeuten extern gepflegte Listen, dass im Grunde jeder sein eigenes
Strukturdatenset anfertigen und in den eigenen METS-Dateien verlinken kann. Das würde zwar
die Abstraktion des Viewers erhöhen, umgekehrt aber auch jede Bemühung um ein
standardisiertes Strukturdatenset zunichte machen.
Ich würde sogar so weit gehen, nicht einmal für verschiedene Medientypen jeweils eigene
Strukturdatensets zu pflegen, sondern nur genau _ein_ Set zu unterstützen, dass jedoch
passende Strukturdaten für verschiedene Medientypen enthält. Statt also für Handschriften
ein eigenes Strukturdatenset zu erstellen, würde ich lieber dem vorhandenen einige
handschriften-spezifische Strukturdaten hinzufügen. (Zumal es ohnehin eine Schnittmenge
zwischen beiden Sets gäbe.) Das hätte den Vorteil, dass der Viewer nicht auch noch vor der
Darstellung der Strukturdaten erst anhand irgendwelcher Kriterien eine Auswahl des
passenden Sets treffen müsste.
Fände ich auch prima. Aus dem ursprünglich
avisierten Treffen im
letzten Jahr in Dresden ist ja leider nichts geworden. Ich denke aber,
daß manche Aspekte dieser Diskussion eher im Kontext "Viewer 3.0" zu
sehen sind. Für "Viewer 2.0" sehe ich die Punkte, die ich oben genannt
habe, aber nicht als Erweiterung, sondern als konsequente Umsetzung des
bereits besprochenen rsp. angedachten, aber nicht durchgeführten...
Ja, ein Treffen fände ich auch prima. Meine ToDo-Liste für Version 2.1 enthält noch
einige weitere Punkte, die ich in den nächsten 1-2 Wochen umsetzen werde. Anschließend
würde sich ein weiteres Treffen zur Diskussion des Arbeitsstands und der nächsten Schritte
anbieten. Ein Termin in der zweiten Märzhälfte wäre mir sehr recht. Ich werde einmal
schauen, wann hier entsprechende Räumlichkeiten frei wären und mache dann auch konkretere
Terminvorschläge.
Viele Grüße
Sebastian Meyer
--
Sebastian Meyer
Projekt-Mitarbeiter
Sächsische Landesbibliothek -
Staats- und Universitätsbibliothek Dresden (SLUB)
01054 Dresden
Tel.: +49 351 4677-206
Fax: +49 351 4677-711
http://www.slub-dresden.de/
> -----Ursprüngliche Nachricht-----
> Von: dv-technik-bounces(a)dfg-viewer.de [mailto:dv-technik-bounces@dfg-
> viewer.de] Im Auftrag von Kay Heiligenhaus
> Gesendet: Samstag, 21. Februar 2009 12:36
> An: dv-technik(a)dfg-viewer.de; dv-technik(a)dfg-viewer.de
> Betreff: Re: [DFG-Viewer] Nutzung des DFG-Viewers in VD16- und VD17-
> Projekten
>
> Lieber Herr Stäcker, liebe Kolleginnen und Kollegen,
>
>> aus unserer Sicht ist die Typisierung mit VD16 und VD17 ok, wir
> müssten
>> es allerdings noch implementieren.
> Wie gesagt, wir müßten es auch bei uns noch umstellen (von 'vda' auf
> 'VD17'). Zu klären wären dann noch, ob wir eine geschlossene Liste von
> Identifier-Typen vorsehen - was ich befürworten würde, denn hier sollte
> m.E. nicht alles mögliche angezeigt werden (MODS macht bzgl. des type-
> Attributes keine Vorgaben). Für die jetzige Umsetzung würde ich
> folgende Liste vorschlagen: 'VD16', 'VD17', 'ZDB'. Der Type
'URN' wird
> ja eh bereits besonders behandelt (was mich dazu bringt anzumerken, daß
> leider weiterhin die Seiten-Identifier (aus dem Attribut "contentids")
> nicht, wie vereinbart, im Viewer angezeigt werden).
>
>> Ich möchte daher noch einmal abstrakt fragen, ob das hier angewandte
>> Prinzip so jetzt ok und praktikabel ist. Ich habe doch einige
> Zweifel.
>> Nehmen wir z.B.
>>
>> <mets:div ID="log809417" TYPE="title_page"
LABEL="Titelblatt"
>> ORDER="1"/>
>> <mets:div ID="log976482" TYPE="section"
LABEL="Leichen-Text. Aus der
>> Geheimten Offenb. S. Johannis Cap. III. v. 5." ORDER="1"/>
>>
>> Daraus lassen sich zwei grundsätzliche Fälle der Strukturdatenvergabe
>> unterscheiden. Zum einen kann neben TYPE, das den englischen
>> "Ansetzungsbegriff" bzw. ID, z.B. title_page oder section, enthält im
>> Label der "Content" dieses Begriffes, hier "Leichen-Text..."
stehen,
>> zum anderen kann das LABEL die Übersetzung des Ansetzungsbegriffs
>> enthalten title_page -> title page oder Titelblatt. Ich frage mich,
> ob
>> diese unterschiedlichen Verwendungen nicht in irgendeiner Form
>> qualifiziert werden sollten. Theoretisch kann man ja bei
>> TYPE="title_page" in LABEL auf den Inhalt der Titelseite schreiben.
> In
>> Ermangelung weiterer qualifizierender Tags könnte man in LABEL auf
> der
>> PCDATA-Ebene qualifizieren, indem z.B. Zitate grundsätzlich mit
>> Anführungszeichen versehen werden:
>>
>> LABEL="'Leichen-Text. Aus der Geheimten Offenb. S. Johannis Cap. III.
>> v.
>> 5.'"
> Oh. Ihr Anliegen kann ich verstehen - wir hatten darüber bereits auf
> dieser Liste diskutiert im Rahmen der Umsetzung der englischsprachigen
> Lokalisierung der Viewer-Implementierung -, aber den Vorschlag finde
> ich aus technischer Sicht ziemlich "wild". Hintergrund des Problems ist
> aus meiner Sicht, daß wir aktuell _gezwungen_ sind, für jedes DIV auch
> ein LABEL-Attribut zu liefern - der Viewer interessiert sich schlicht
> nicht für das TYPE-Attribut. Damit gehen aber alle Möglichkeiten
> verloren, die die Verwendung eines kontrollierten Vokabulars eröffnen.
> Konzept war und muß aus meiner Sicht hier sein: Das TYPE-Attribut ist
> verpflichtend, das LABEL-Attribut ist optional. Wenn ein LABEL
> vorhanden ist, wird dies ohne Berücksichtigung des aktuellen
> Sprachmodus des Viewers angezeigt. Wenn kein LABEL vorhanden ist, dann
> wird TYPE ausgewertet und entsprechend unserer abgestimmten Liste unter
>
>
http://dfg-viewer.de/strukturdatenset/
>
> in der jeweils im Viewer gewählten Sprache angezeigt. Am besten - um
> das voneinander abzuheben - in eckigen Klammern. So jeweils hatte ich
> den letzten Diskussionstand verstanden.
>
> Für mein ursprüngliches Beispiel unter
http://digitale.bibliothek.uni-
> halle.de/oai/?verb=GetRecord&metadataPrefix=mets&identifier=692944
> konkretisiert hieße das:
>
> <mets:structMap TYPE="LOGICAL">
> <mets:div ID="log692944" DMDID="md692944"
ADMID="amd692944"
> TYPE="monograph" LABEL="Album Electorum Das Stamm- und Lebens
Buch"
> ORDER="1" CONTENTIDS="urn:nbn:de:gbv:3:1-79574">
> <mets:mptr LOCTYPE="URL"
> xlink:href="http://digitale.bibliothek.uni-
>
halle.de/oai/?verb=GetRecord&metadataPrefix=mets&identifier=692944"/>
> <mets:div ID="log809417" TYPE="title_page"
ORDER="1"/>
> <mets:div ID="log809419" TYPE="dedication"
ORDER="2"/>
> <mets:div ID="log809421" TYPE="section"
ORDER="3">
> <mets:div ID="log976482" TYPE="section"
LABEL="Leichen-Text. Aus
> der Geheimten Offenb. S. Johannis Cap. III. v. 5." ORDER="1"/>
> <mets:div ID="log976483" TYPE="section"
LABEL="Eingang."
> ORDER="2"/>
> <mets:div ID="log976484" TYPE="section"
LABEL="Abhandlung."
> ORDER="3"/>
> </mets:div>
> <mets:div ID="log809455" TYPE="section"
LABEL="Lebens-Lauff."
> ORDER="4"/>
> <mets:div ID="log809465" TYPE="section"
LABEL="Abdanckungs-Rede."
> ORDER="5"/>
> </mets:div>
> </mets:structMap>
>
>> Anfühungszeichen, das ist mir bewusst, machen natürlich beim
>> Prozessieren immer Schwierigkeiten und müssen maskiert werden, daher
>> wäre auch dies denkbar:
>>
>> LABEL="<q>Leichen-Text. Aus der Geheimten Offenb. S. Johannis Cap.
> III.
>> v. 5.</q>"
> Jetzt wird es m.E. "ganz wild". Das bringt einen Metsologen - ich
> selbst verstehe mich nicht als einen - wohl an den Rand des Kollaps. ;)
>
>> Zum anderen noch die Frage, ob wir eine Qaulifizierung der Sprache
>> brauchen. Geht so etwas (ich habe es nicht geprüft):
>>
>> <mets:div ID="log809417" TYPE="title_page"
LABEL="Titelblatt"
>> xml:lang="de" ORDER="1"/>
>>
>> Das ist für die Anzeige vielleihct nicht ganz so wichtig, wohl aber
> für
>> das Einsammeln von Daten, die nicht der Viewer-Strukturliste folgen
> Das finde ich eine gute Anregung. Allerdings kann ich aktuell mangels
> Zugriff auf die LoC-Seiten auch nicht beurteilen, ob das METS-technisch
> so in Ordnung wäre.
>
>> Das bringt mich dann zu der Frage, ob man nicht grundsätzlich eher
>> anders vorgehen sollte und in TYPE die Art des Strukturdatensets
>> vermerkt und in LABEL den Ansetzungsbegriff. Dann müsste an anderer
>> Stelle auf die Repräsentation des Ansetzungsbegriffs verwiesen werden
>> (z.B. Strukturdatenliste, Ortsnamenliste, Personennamenliste,
>> Fachthesaurus, etc.):
>>
>> <mets:div ID="log809417" TYPE="structMD-dv"
LABEL="title_page"
>> ORDER="1"/>
>>
>> oder
>>
>> <mets:div ID="log809417" TYPE="ortsnamen"
LABEL="Nummer Getty
>> Thesaurus/Geodaten" ORDER="1"/>
> Oh. Damit kommen wir m.E. in Teufelsküche, denn TYPE dient ganz sicher
> nicht dazu, eine Referenz auf ein kontrolliertes / nicht kontrolliertes
> Vokabular zu machen. Das müßte m.E., wenn überhaupt, an anderer Stelle
> geschehen.
>
>> Wäre es angesichts dessen nicht sinnvoll, sich noch eimal zu treffen
>> und diese Aspekte zu diskutieren und endgültig zu verabschieden? Mir
> fehlt
>> hier einfach noch ein Baustein.
Fände ich auch prima. Aus dem ursprünglich
avisierten Treffen im
letzten Jahr in Dresden ist ja leider nichts geworden. Ich denke aber,
daß manche Aspekte dieser Diskussion eher im Kontext "Viewer 3.0" zu
sehen sind. Für "Viewer 2.0" sehe ich die Punkte, die ich oben genannt
habe, aber nicht als Erweiterung, sondern als konsequente Umsetzung des
bereits besprochenen rsp. angedachten, aber nicht durchgeführten...
>
> Beste Grüße,
> Kay Heiligenhaus
--
Dr. Thomas Staecker (Leiter Abteilung Alte Drucke, Digitalisierung)
Herzog August Bibliothek - Postfach 1364 - D-38299 Wolfenbuettel
Tel. +49(0)5331/808-119 - email: staecker(a)hab.de