Lieber Herr Meyer,
wir bereiten aktuell ein paar Beispiele vor, um die Diskussion über die Navigation in periodischen Werken (also zunächst Zeitschriften und Zeitungen) anhand konkreter digitalisierter Objekte weiterführen zu können. Dabei stellt sich zunächst eine grundsätzliche Frage, bei der Sie mir vielleicht auf die Sprünge helfen können. Hier zunächst das Beispiel einer Zeitschrift:
1) Zeitschrift im Viewer
http://dfg-viewer.de/v2/?set[mets]=http%3A%2F%2Fs2w.visuallibrary.net/pk%2F…
2) Band im Viewer
http://dfg-viewer.de/v2/?set%5Bimage%5D=1&set%5Bzoom%5D=default&set%5Bdebug…
Wie Sie sehen können, sind die Metadaten des Bandes nicht ganz so, wie ich mir das gedacht hätte. Anstelle der Angaben zu Zeitschrift und Band findet sich "###TITLE### ###VOLUME######PLACE### ###DATE###" in der Titelzeile des Viewers. Hier das zugrundeliegende METS/MODS des Bandes:
3) METS/MODS für Band
http://s2w.visuallibrary.net/pk/oai/?verb=GetRecord&metadataPrefix=mets&ide…
Es finden sich folglich sowohl zur Zeitschrift (DMDID md23303) als auch zum Band (DMDID sd24361) MODS-Daten, die m.E. korrekt in der METS-Struktur referenziert werden. Allerdings scheinen Sie bei der Viewer-Implementierung davon auszugehen, daß sich alle notwendigen Daten für die Anzeige ausschließlich im MODS des Bandes finden - also auch die MODS-Informationen zur Überordnung. Allerdings gehe ich nicht davon aus, daß Sie Informationen aus einem relatedItem[@type='host'] auswerten, das ja hier gebildet werden müßte zur Aufnahme der bibliographischen Informationen der Zeitschrift.
Sehe ich das richtig und es handelt sich um einen "Bug"? Oder, falls nicht, wie müßte man es umsetzen, damit der Viewer die Daten versteht (und diese weiterhin MODS-konform bleiben)?
Beste Grüße,
Kay Heiligenhaus
Liebe Liste,
Bei dem von Herrn Heiligenhaus am Dienstag angesprochenen Punkt geht es
um die Frage, ob es notwendig ist, alle Verknuepfungen zwischen
logischer und physischer Struktur vollstaendig in der METS Datei
aufzunehmen. Zentraler Punkt hierbei sind Verknuepfungen von
untergeordneten logischen Einheiten zu physischen Struktureinheiten
(d.h. Unterkapitel zu Seiten). Derzeit haben sowohl Unterkapitel als
auch Kapitel Verknuepfungen zu den jeweiligen Seiten. Diese
Verknuepfungen sind tatsaechlich redundant, da auf Grund der
hierarchischen Stuktur Kapitel und Unterkapitel auf diesselben Seiten
verweisen. Diese Redundanz fuehrt in der METS Datei zu einer relativ
grossen structLink-Sektion und zu grossen Dateien.
Zunaechst moechte ich mal annehmen,dass das Datenmodell fuer alle
seitenbasierten Medienarten gelten soll - unabhaengig davon, ob die
Beschreibung einer digitalen/digitalisierten Resource alle Teile des
Modells in voller Granularitaet ausschoepft oder nicht. Es ist weiterhin
wichtig zu verstehen, dass das Modell mehr Funktionalitaet erlaubt als
derzeit im DFG Viewer umgesetzt ist - gerade hinsichtlich der physischen
Struktur (=Seiten/Spalten/Textbereichte).
Generell stellt sich also die Frage, warum Verknuepfungen auf
ueberliegender Ebene gespeichert werden, wenn sie auf unterliegender
Ebene vorhanden sind:
1) Ein Kapitel kann laenger sein als die Summe aller Unterkapitel - oder
allgemein: Die summe aller logischer Unterstrukturen ist kleiner als die
ueberliegende Struktur. Dies kann damit zusammenhaengen, dass sich nicht
alle Unterstrukturen (automatisiert) erfassen lassen oder aber das die
ueberliegende Struktur tatsaechlich noch ueber zusaetzlichen
Inhalte/Seiten verfuegt.
2) D.h. Lesereihenfolge von ueber- und untergeordneten logischen
Einheiten kann unterschiedlich sein. Diese Reihenfolge wird jedoch durch
die Verknuepfung in der log. und phys. Einheit in der structLink Section
angegeben. Die smLink Elemente muessen in entsprechender
Blaetter/Lesereihenfolge angeordnet sein. Das ist zugegebenermassen
nicht sehr explizit ausgedrueckt; eine solche Moeglichkeit gibt es
allerdings erst ab METS 1.8.
Als Beispiel mag hier eine Tageszeitung dienen. Die einzelnen Sektionen
(Sport, Wirtschaft, Feuilleton) werden als uebergeordnete Einheit
betrachten und durch ein entsprechendes logisches <div> in der METS
Datei aufgenommen. Die Seiten werden mit dieser ueberliegenden Einheit
verknuepft - vermutlich in der Reihenfolge der Seitenpaginieren. Denn so
wuerde man durch diese Sektion durchblaettern/lesen.
Unterliegende Artikel werden als Kind <div> Element implementiert. Die
Lesereihenfolge der Artikel allerdings koennen unterschiedlich der
Seitenpaginierung sein. Zum einen kann Artikel auf Seite 1 beginnen und
anschliessend auf Seite 3 fortgefuehrt werden. Zum anderen koennen
Artikel aber auch auf der letzten Seite beginnen und innen fortgefuehrt
werden. Dies ist zumindest hier in UK regelmaessig beim Sportteil der
Fall. Dieser stellt die Rueckseitige Titelseite und wird von "hinten
nach vorne" gelesen.
3)
Bislang sind wir davon ausgegangen dass logische Verknuepfungen aus
unterscheidlicher Hierarchieebene auf physische Einheiten derselben
Hierarchiestufe (=Seiten) zeigen. Sobald die physische Seite jedoch auch
weiter untergliedert wird in Spalten und Textbloecke, wird die
Verknuepfung unterliegender logischen Einheiten nicht mehr auf
Seitenebene geschehen, sondern auf Textblockebene. Dies ist zumindest
bei Tageszeitungen der Fall, kann jedoch auch bei Monographien und
Zeitschriften passieren: Auch fuer diese Strukturtypen laesst sich eine
Seite in verschiedene Textbloecke aufteilen. Angenommen eine Seite
beherbergt das Ende eines und den Start eines zweiten Unterkapitels, so
laesst sich die Seite in zwei Textbloecke zerteilen. Aus den
Unterkapiteln wird neben den anderen Seiten nur der jeweilige Textblock
(Start bzw. Ende) verwiesen.
In dem Fall, wird also auf sehr granulare Einheiten von den
Unterkapiteln verwiesen. Fuer die uebergeordnete Einheit sind die
Textbloecke jedoch unwichtig. Da die komplette Seite zu dem Kapitel
gehoert, wird auch nur auf sie verwiesen und nicht auf die Textbloecke.
Weitere Untereinheiten koennten naemlich ebenso zu dem Kapitel gehoeren,
nicht jedoch zu einem der Unterkapitel (siehe (1)).
Das Datenmodell ist nun einmal so komplex, wie es derzeit im METS Profil
dokumentiert ist. Die serialisierung in METS liesse sich vereinfachen,
wenn bestimmte Annahmen getroffen werden. Diese Annahmen muss der
DFG-Viewer beruecksichtigen; d.h. diese muessen implementiert werden.
Das ist fuer viele Faelle sicherlich machbar, wenn auch kompliziert,
wenn tiefere Strukturen als Seiten oder zusaetzliche Funktionalitaeten
beruecksichtig werden. Derzeit muss die Software lediglich log/phys
Relationen beruecksichtigen; Hierarchien in der log. Struktur koennen
unberuecksichtigt bleiben.
Entsprechend ausfuehrliche und grosse METS Dateien automatisiert zu
generieren scheint mir da das kleinere Uebel zu sein. An welcher Stelle
wirkt sich denn die Groesse der METS Datei nachteilig aus? Beim parsen?
uebertragen?
Ich sehe zumindest kein Problem, dem nicht mit etwas mehr Resourcen
beizukommen waere.
Ciao
Markus Enders
Liebe Liste,
nach unserem Treffen letzte Woche habe ich versucht ein Beispiel für die Zeitungsnavigation zu erstellen. Folgendes ist dabei herausgekommen:
(Ich bitte zu berücksichtigen, dass ich im Moment alles manuell erstelle und daher die meisten Links ins Leere führen. Ich hoffe jedoch, dass der Ansatz klar wird.)
Die Navigation findet in zwei Schichten statt
1. Übersicht des Titels mit Erscheinungsjahren und eventuellen Beilagen und "Ausgaben"
* Erscheinungsjahre werden auf die zweite Schicht (Jahresschicht) gelinkt.
* Beilagen in dieser Schicht werden auf die oberste Schicht der Beilage gelinkt.
* "Ausgaben" sind so etwas wie Regional-Ausgaben und werden wie Beilagen behandelt (nicht im Beispiel vorhanden)
* Ansicht im Viewer: http://dfg-viewer.de/demo/viewer/?set[mets]=http%3A%2F%2Fzefys.staatsbiblio…<http://dfg-viewer.de/demo/viewer/?set%5bmets%5d=http%3A%2F%2Fzefys.staatsbi…>
* METS-Datei: http://zefys.staatsbibliothek-berlin.de/fileadmin/mets/kreuz.xml
2. Übersicht des Erscheinungsjahres eventuellen Beilagen und "Ausgaben"
* Vorhandene Monate werden nur als Strukturelement genutzt und verweisen auf die aktuelle Schicht
* Vorhandene Tage und Editionen (Morgen-, Abend-, Extra-Ausgabe) verweisen auf die Standard-Ansicht der Ausgabe
* Beilagen in dieser Schicht werden auf die Jahresschicht der Beilage gelinkt (analog zu dieser Schicht).
* Ausgaben in dieser Schicht werden auf die Jahresschicht der Ausgabe gelinkt (analog zu dieser Schicht).
* Ansicht im Viewer: http://dfg-viewer.de/demo/viewer/?set[mets]=http%3A%2F%2Fzefys.staatsbiblio…<http://dfg-viewer.de/demo/viewer/?set%5bmets%5d=http%3A%2F%2Fzefys.staatsbi…>
* METS-Datei: http://zefys.staatsbibliothek-berlin.de/fileadmin/mets/kreuz_1857.xml
In der Jahresschicht würden somit maximal 378 (1 Titel + 12 Monate + 365 Tage) Strukturelemente + Ausgaben, Beilagen und Editionen vorkommen. Ich denke, dass das noch recht übersichtlich sein dürfte.
Über Kritik und Anmerkungen würde ich mich sehr freuen.
Mit freundlichen Grüßen,
Carsten Schulze
*********************************************************
Carsten Schulze
Staatsbibliothek zu Berlin
Zeitungsinformationssystem
Postanschrift: 10772 Berlin
Hausanschrift: Potsdamer Str. 33, 10785 Berlin
Telefon: +49 (0) 30 - 266 435781
E-Mail: carsten.schulze(a)sbb.spk-berlin.de<mailto:carsten.schulze@sbb.spk-berlin.de>
*********************************************************
Liebe Kollegen,
wir hatten ja in Berlin beschlossen, die Normdaten in MODS über xlink anzubinden. Herr Heiligenhaus wollte dazu Beispiele bringen(?) Haben Sie da eventuell schon eines parat? Die Frage (z.B. bei den Personen) ist ja z.B., ob man nur das xlink-Attribut href verwendet oder noch weitere, um die Normdatei zu bezeichnen ... Hat vielleicht schon jemand hierzu konkretere Vorstellungen?
Danke und einen schönen Feiertag wünscht
Maria Federbusch
Wissenschaftliche Referentin
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz
Abteilung Historische Drucke
Unter den Linden 8
D-10117 Berlin
Tel.: ++49-(0)30-266-43 66 01
E-Mail: maria.federbusch(a)sbb.spk-berlin.de<mailto:maria.federbusch@sbb.spk-berlin.de>
http://staatsbibliothek-berlin.de/historische-drucke.html
Sehr geehrte Damen und Herren,
zur Zeit bin ich mit einem Projekt der Universitätsbibliothek Würzburg betraut, in dem es darum geht,
Material für die Ansicht im DFG-Viewer aufzubereiten (xml Dateien erstellen/konvertieren).
Dabei bin ich auf zwei Probleme gestoßen:
1. Könnten Sie mir bitte kurz erläutern, wie man die zum Download bereitgestellte TYPO3 Extension benutzt.
Leider konnte ich dazu keine Dokumentation finden.
Ist es des Weiteren möglich, diese Extension auf dem Server zu betreiben, so dass keine Verlinkung der xml Datei
auf die Seite des DFG-Viewers nötig ist?
2. Beim Testen mittels Verlinkung auf die DFG-Viewer Seite tritt der Fehler auf, dass die Datei nicht gefunden wird.
Ich vermute, dass das Problem darin liegt, dass die Datei nicht mittels http sondern https übertragen wird.
Könnten Sie mir bitte diesbezüglich Klarheit verschaffen.
Für die Beantwortung meiner Fragen danke ich im Voraus
Andreas Wendl
Liebe Kolleginnen und Kollegen,
für unsere morgige Sitzung anbei ein Vorschlag zur Integration von TEI
in METS, den Herr Schassan vorbereitet hat. Enthalten ist das
Ausgangsdokument, ein Konversionsskript sowie das Zieldokument. Unser
Vorschlag würde dahin gehen, zum Zwecke des Harvestens durch ManuMed
oder zvdd diesen Minimalsatz im Rahmen der in <msDesc> in
tei-msdesc_Butzmann.xml enthaltenen Daten zu erweitern. Die
Vollbeschreibung folgt dem zusammen mit ManuMed und der BSB München
entwickelten Austauschformat auf der Basis von ursprünglich MASTER,
jetzt TEI-P5. Eine Schnittstelle zu ManuMed wurde bereits im Rahmen
eines DFG Projektes (vgl.
http://www.hab.de/forschung/projekte/master.htm) implementiert.
Viele Grüße,
Ihr
Th. Stäcker
--
Dr. Thomas Staecker (stellv. Direktor; Leiter Abteilung Integrierte Medienbearbeitung, Benutzung; komm. Leiter Alte Drucke, Digitalisierung) Herzog August Bibliothek - Postfach 1364 - D-38299 Wolfenbuettel Tel. +49(0)5331/808-303 - email: staecker(a)hab.de
Liebe Community,
Im Zuge des Entstehens eines METS/TEI-Formats für Handschriften hat Herr Schaßan darauf hingewiesen, dass es im TEI-Standard bereits eine Art Strukturdatenset gibt: http://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-objectDesc.html
Die Angaben "codex, roll, fragment, partial leaf, cutting" haben dort zwar einen etwas anderen Charakter, da es sich um eine offene Liste handelt, die prinzipiell beliebig ergänzt werden kann. Dennoch können wir sie als Orientierung verstehen.
Der Vorschlag von Herrn Schaßan, dem ich mich hiermit anschließen möchte, lautet nun, dass wir unser Strukturdatenset an diese TEI-Liste anlehnen. Konkret würde das bedeuten, dass wir das Strukturdatum "Handschrift/manuscript" unserer Liste durch "Codex/codex" ersetzen und das Set um die Strukturdaten "roll", "partial leaf" und "cutting" ergänzen ("Fragment/fragment" ist ja bereits Teil unseres Sets).
Das hätte ein paar Vorteile:
- Ein Mapping von TEI nach METS wäre einfacher, da der Wert in <objectDesc form="..."> in der Regel direkt nach <div TYPE="..."> übernommen werden könnte.
- Die Doppelbedeutung von "Handschrift" im Deutschen würde entschärft werden.
Da meines Wissens nach bislang noch niemand das Strukturdatum "manuscript" verwendet, wäre eine Änderung zum jetzigen Zeitpunkt noch unkritisch. Was meinen Sie?
Viele Grüße
Sebastian Meyer
--
Sebastian Meyer
Projekt-Mitarbeiter
Sächsische Landesbibliothek -
Staats- und Universitätsbibliothek Dresden (SLUB)
01054 Dresden
Tel.: +49 351 4677-206
Fax: +49 351 4677-711
http://www.slub-dresden.de/
Lieber Herr Staecker, lieber Herr Meyer,
ich sehe schon, Sie moechten Herrn Enders nicht dabeihaben. Aber ich
haette gegen Berlin auch nichts einzuwenden... ;)
Bei mir ginge nach Ostern nur die Woche vom 19.-23.4. In der Woche
davor ist Inetbib-Tagung.
Beste Gruesse,
KH
Am 01.03.2010 um 19:12 schrieb Thomas Stäcker <staecker(a)hab.de>:
> Liebe Frau Federbusch,
>
> wie gesagt, ich hielte es für sinnvoll, und um meine Präferenz für
> einen bestimmten Ort habe ich ja auch keinen Hehl gemacht ;-) Es kä
> me auf den Termin an. In der direkten Woche danach könnte ich nicht,
> aber im weiteren z.B. 14., 15, 16.4.
>
> Viele Grüße,
> Ihr
> Th. Stäcker
> Federbusch, Maria schrieb:
>> Liebe Kollegen,
>>
>> Habe interessiert Ihre Diskussion verfolgt, konnte aber leider aus
>> Zeitgründen nicht mit einsteigen. Eine Frage rein organisatorische
>> r Art ist bei mir noch offen geblieben:
>> Wie man ja auch an dieser Diskussion sieht, ist ja einiges zu
>> besprechen. Wollen wir uns treffen, und wenn ja, wann? Herr Meyer
>> hatte ja sogar Vorschläge für eine Tagesordnung gemacht. Lose war
>> bereits die Zeit nach Ostern im Gespräch ... Die Orte Aachen und B
>> erlin waren vorgeschlagen worden... Wie denken Sie darüber?
>>
>> Beste Grüße auf die Schnelle aus Berlin
>> Von M. Federbusch
>>
>
>
> --
> Dr. Thomas Staecker (stellv. Direktor; Leiter Abteilung Integrierte
> Medienbearbeitung, Benutzung; komm. Leiter Alte Drucke,
> Digitalisierung) Herzog August Bibliothek - Postfach 1364 - D-38299
> Wolfenbuettel Tel. +49(0)5331/808-303 - email: staecker(a)hab.de
>
>
>
Liebe Viewer-Nutzer,
wir sind in einem Projekt nun mit der Frage konfrontiert, wie sich Zeitungen für den DFG-Viewer aufbereiten lassen, insbesondere, welche Strukturtypen hier zu vergeben sind. Ein Blick auf unser Strukturdatenset zeigt, daß wir uns zwar bereits mit dem Thema "Periodika" ausführlich beschäftigt haben (die Strukturtypen periodical, volume, issue sind hier einschlägig [1]), aber sie scheinen mir für die Erschließung von Zeitungen nicht wirklich treffend.
Ein Blick auf die Aktivitäten der Staatsbibliothek Berlin, die ja einen erfreulich großen Bestand von Zeitungen bereits ins Netz gestellt hat [2], ist hier leider noch wenig hilfreich. Die METS-Daten für die Zeitungen basieren noch auf dem Viewer-Profil v.1 und enthalten folglich keinerlei Strukturdaten [3]. Ein Blick auf die (m.E. sehr gelungene) Präsentation der "Amtspresse Preußens" im Netz zeigt jedoch m.E. einen denkbaren Weg für die einheitliche Strukturierung von Zeitungsmaterialien [4]. Notwendige Voraussetzung für eine solche Modellierung könnte es folglich sein, daß man Strukturtypen wie "year", "month", "day" einführt. Nun haben wir aber auch Wochenzeitungen, Morgen- und Abendausgaben usw. Dies könnte man natürlich in der vorgeschlagenen Form ebenfalls unterbringen (Einführung der Strukturtypen "week", "morning", "evening") - und hätte damit eine gut navigierbare Repräsentationsform im Viewer (und beim Harvesting m.E. den entscheidenden Vorteil, daß man solche "Synopsen" erstellen kann, wie es die Staatsbibliothek für die beiden Zeitungen der Amtspresse Preußens gemacht hat). Die Frage ist nur: Läßt sich das a) tatsächlich so generalisiert modellieren und b) ist es tatsächlich sinnvoll, es so zu modellieren?
Gibt es hier Erfahrungen in anderen Häusern? Natürlich insbesondere in der Staatsbibliothek Berlin? Sollen wir Zeitungen im Viewer strukturtypologisch eigens behandeln? Aus meiner Sicht hat sich in der Forschung die typologische Differenzierung zwischen "Zeitung" und "Zeitschrift" durchgesetzt [5]. Das spricht m.E. auch für eine differenziertere Behandlung dieser Publikationsformen im Viewer Strukturdatenset. Andererseits bin ich daran interessiert, hier nicht einfach die Schleusen für eine beliebig ausdifferenzierte Strukturerschließung zu öffnen. Was meinen Sie?
Beste Grüße,
Kay Heiligenhaus
[1] http://dfg-viewer.de/strukturdatenset/
[2] http://digital-b.staatsbibliothek-berlin.de/digitale_bibliothek/digital.php…
[3] http://digital-b.staatsbibliothek-berlin.de/digitalisate/anzeiger_fuer_das_…
[4] http://amtspresse.staatsbibliothek-berlin.de/verzeichnis.php
[5] Als Beispiel hier nur: http://www.genesee.edu/library/infolit/Guides/Periodical_Journal_or_Magazin…
Liebe Kollegen,
seit langem mal wieder eine Frage zum METS-Profil - es geht um die <mets:structMap TYPE="PHYSICAL">.
Wir möchten gern in unseren METS-Daten derjenigen Seite eine Kennung mitgeben, die für eine Trefferlistendarstellung den "Aufmacher" in Form eines Thumbnails darstellt. In der Regel ist das bei Drucken das Titelblatt; bei Handschriften wird es ein anderes Bild sein. Indirekt liegen die Informationen zwar für die Drucke vor (Titelblatt ist in Strukturdaten ausgezeichnet), wir wollen es aber gern direkt auszeichnen. Kennen Sie dazu bereits Lösungen? Wie machen Sie's in Göttingen? Darf man dafür das LABEL-/ TYPE-Element mißbrauchen? Oder wäre es besser, direkt bei der File-beschreibung des Thumbs ein Attribut zu setzen? Gibt es in ZVDD dazu Überlegungen, ob und wie Thumbnails in der Trefferliste angezeigt werden sollen?
Erste wilde Ideen wären diese:
<mets:structMap TYPE="PHYSICAL">
<mets:div TYPE="physSequence">
<mets:div ID="ex12__PHY_00" ORDER="1" ORDERLABEL="I" TYPE="banner" TYPE="page">
<mets:fileGrp USE="THUMBS">
<mets:file ID="ex07__FILE00_THB" MIMETYPE="image/png" SIZE="8234" USE="banner">
<mets:FLocat LOCTYPE="URL" xlink:href="http://link/to/thumb/image/00.png" />
</mets:file>
Für Ihre Hilfe dankt schon einmal ...
M. Federbusch
P.S. Sind jemandem beim Prüfen der MODS-Version 3.3 für uns relevante Abweichungen aufgefallen?
Maria Federbusch
Wissenschaftliche Referentin
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz
Abteilung Historische Drucke
Unter den Linden 8
D-10117 Berlin
Tel.: ++49-(0)30-266-43 66 01
E-Mail: maria.federbusch(a)sbb.spk-berlin.de <mailto:maria.federbusch@sbb.spk-berlin.de>
http://staatsbibliothek-berlin.de/historische-drucke.html