RSWK reloaded – Verbale Sacherschließung im Jahr 2018

Maschine oder Mensch: Wer wird künftig die Sacherschließung in Bibliotheken vornehmen? Autorin Heidrun Wiesenmüller plädiert für einen ausgewogenen und durchdachten Mix unterschiedlicher Methoden. Foto: ©peshkova / Fotolia

Interesse an einem bestimmten Thema und der Wunsch nach Literatur, die sich damit beschäftigt, ist vermutlich einer der häufigsten Gründe, warum Menschen sich an Bibliotheken wenden. Umso eigenartiger ist es, dass die bibliothekarische Sacherschließung (oder Inhaltserschließung, wie sie heute oft heißt) so wenig Lobby hat und vielfach nur als Kostenfaktor wahrgenommen wird. Eine gute inhaltliche Erschließung baut eine Brücke zwischen Ressourcen und Nutzern, indem sie einerseits einen gezielten Zugang zu relevanter Literatur und andererseits schnelle Orientierung über den Inhalt von Dokumenten ermöglicht.

Die Verwendung von natürlicher Sprache kommt Nutzerinnen und Nutzern dabei entgegen; die verbale Erschließung stellt sozusagen ein niederschwelliges Angebot dar. Die Allgegenwart von »Tags« zeigt, dass das Grundprinzip auch für Nichtfachleute leicht zu verstehen ist. Die bibliothekarische Erschließung arbeitet freilich mit normierten Schlagwörtern und klar definierten Verwendungsregeln, um eine einheitliche Anwendung zu erzielen. Auch erhält man immer dieselben Treffer, egal ob man mit der Vorzugsform sucht oder einem Synonym.

Anders als Notationen, die für sich alleine genommen ohne Aussagekraft sind, lässt sich das Thema einer Ressource über die vergebenen Schlagwörter oft schneller und zuverlässiger erfassen als über den Titel. Mit Schlagwörtern kann außerdem auch nach sehr speziellen Themen gesucht werden, die man mit einer Notation nicht mehr ausdrücken könnte. Für Überblicksrecherchen zu größeren Themenbereichen sind hingegen Klassifikationen besser geeignet. Optimal ist es daher, wenn Dokumente sowohl verbal als auch klassifikatorisch erschlossen sind.

Der Bereich der verbalen Erschließung ist schon seit einigen Jahren in Bewegung und steht aktuell vor verschiedenen Herausforderungen; der vorliegende Beitrag gibt dazu einen Überblick.

RSWK im Wandel

Anders als bei den Systematiken gibt es für die verbale Sacherschließung seit über 30 Jahren einen einheitlichen Standard im deutschsprachigen Raum, der eine breite Nachnutzbarkeit und einen hohen Grad an Rationalisierung gewährleistet: die RSWK. Bei ihrer Erarbeitung folgte man der Erkenntnis, dass Regeln alleine nicht ausreichen, um eine gleichmäßige Anwendung zu garantieren – vielmehr müssen auch die Schlagwörter selbst normiert werden. Dies geschah anfangs über eine Standardschlagwortliste, später mithilfe der Schlagwortnormdatei (SWD) als einem Universal-Thesaurus. Das Regelwerk wurde kontinuierlich von der jeweils zuständigen Expertengruppe weiterentwickelt und hat jüngst sogar seinen Namen geändert: Seit 2017 steht RSWK nicht mehr für »Regeln für den Schlagwortkatalog«, sondern für »Regeln für die Schlagwortkatalogisierung«.

Im Jahr 2010 wurden die RSWK erheblich verschlankt und vereinfacht. Dazu gehörte auch die Umgestaltung der früheren Schlagwortketten in einfacher zu handhabende Schlagwortfolgen. Seitdem sind bei der Reihenfolge der Schlagwörter weniger Regeln zu beachten, und vielfach genügt eine Schlagwortfolge, wo früher mehrere Ketten gebildet werden mussten. Ein weiterer Meilenstein war die Einführung der Gemeinsamen Normdatei (GND) im Jahr 2012. Die neue integrierte Normdatei, in der auch die SWD aufging, brachte nicht nur eine völlig neue Struktur der Normdatensätze mit sich, sondern auch viele Veränderungen bei Namen beziehungsweise Benennungen. Für diejenigen Entitäten, die sowohl in der Formal- als auch der Sacherschließung verwendet werden – insbesondere Personen, Körperschaften und Geografika – wurden gemeinsame Regeln entwickelt, die sich bereits an der angloamerikanischen Tradition orientierten. Sie sollten die Zeit bis zur Einführung des Katalogisierungsstandards Resource Description and Access (RDA) überbrücken und wurden separat als sogenannte »Übergangsregeln« veröffentlicht. Ein großer Teil davon ist mittlerweile von den entsprechenden Bestimmungen in RDA und den Anwendungsrichtlinien für den deutschsprachigen Raum (D-A-CH) abgelöst worden. Die im Jahr 2017 erschienene 4. Auflage der RSWK[1] trägt dem Rechnung, indem an vielen Stellen nur noch auf RDA beziehungsweise D-A-CH verwiesen wird. Davon nicht abgedeckte Regelungen wurden in die RSWK-Neuauflage eingearbeitet.

Eine weitere grundlegende Neuerung in der 4. Auflage der RSWK betrifft die früheren Formschlagwörter. Mit der Einführung von RDA gingen diese im neuen Konzept der Formangaben auf und werden nun kooperativ von der Formal- und Sacherschließung erfasst.[2] Damit wird Doppelarbeit vermieden, denn zuvor wurden etliche Formaspekte nicht nur als Schlagwort, sondern auch als Code in der Formalerschließung erfasst. Die Formangaben sind nicht mehr Teil der Schlagwortfolge, sondern stehen als getrennte Angaben in eigenen Feldern. Man kann sie gut für eine Facette auswerten, um Einschränkungen nach Kategorien wie »Comic«, »Hörbuch« oder »Konferenzschrift« zu ermöglichen.

Wie die Beispiele zeigen, hat sich die Zusammenarbeit zwischen Formal- und Sacherschließung in der jüngeren Vergangenheit verstärkt. Dies spiegelt sich auch in einer veränderten Gremienstruktur wider: Seit 2017 gibt es keine getrennten Expertengruppen mehr; die neue Fachgruppe Erschließung ist für Formal- und Sacherschließung zuständig.

Sacherschließung mit RDA?

Die Einführung von RDA weckte bei manchen die Erwartung, dass das neue Regelwerk nicht nur die Regeln für die alphabetische Katalogisierung (RAK), sondern auch die RSWK ablösen würde – man also künftig gar keine speziellen Regeln für die verbale Erschließung mehr benötigen würde. Hintergrund solcher Überlegungen war die Tatsache, dass RDA auf dem FRBR-Modell (Functional Requirements for Bibliographic Records) beruht, welches auch die Sacherschließung mit einbezieht. Entsprechend waren in RDA mehrere Kapitel zu Aspekten der inhaltlichen Erschließung vorgesehen, die zu einem späteren Zeitpunkt ausgearbeitet werden sollten.

Diese Planung wurde jedoch später revidiert, als man erkannte, dass die Vielfalt der vorhandenen Sacherschließungssysteme mit einem einzigen Regelwerk nicht befriedigend abgebildet werden kann. RDA setzt deshalb ganz bewusst nur einen allgemeinen Rahmen für die inhaltliche Erschließung und hat nicht den Anspruch, Standards wie die Library of Congress Subject Headings (LCSH) oder die Dewey Decimal Classification (DDC) abzulösen. Das im Jahr 2015 ergänzte Kapitel 23 von RDA sagt nicht viel mehr aus, als dass Beziehungen zu Themen erfasst werden können. Details wie die Form von Schlagwörtern oder Notationen sowie die Verwendungsregeln bleiben dem jeweils angewendeten Sacherschließungssystem überlassen.

Die wenigen von RDA selbst zur Verfügung gestellten Werkzeuge beschränken sich auf diejenigen Entitäten, die auch für die Formalerschließung relevant sind – beispielsweise Personen, die ja nach RDA beschrieben werden. Über eine Beziehungskennzeichnung kann man seit Kurzem auch ausdrücken, dass eine Person Thema eines Werks ist. Der für die verbale Erschließung ganz zentrale Bereich der Sachbegriffe (Sachschlagwörter) bleibt jedoch in RDA völlig ausgeblendet. Für diese gibt es keine Regeln, und dies wird sich auch bei der geplanten Weiterentwicklung von RDA nicht ändern. Ebenso wenig ist eine Ergänzung von Regeln für die Verwendung von Schlagwörtern zu erwarten.

Auch künftig werden also spezielle Regeln für die verbale Sacherschließung nötig sein, um diejenigen Bereiche abzudecken, für die sich RDA (aus gutem Grund) nicht zuständig fühlt.[3] Jedoch gibt es im deutschsprachigen Raum Überlegungen, solche Regeln mittelfristig nicht mehr in Form eines eigenständigen Dokuments zu halten, sondern sie – ähnlich wie die D-A-CH-Richtlinien – in das RDA Toolkit zu integrieren. Im Auftrag des Standardisierungsausschusses beschäftigt sich seit Kurzem ein Expertenteam mit der Weiterentwicklung der RSWK und wird auch diese Frage betrachten.

Maschine versus Mensch

Sacherschließung macht selten Schlagzeilen. Doch im Sommer 2017 brachte sie es bis ins Feuilleton der Frankfurter Allgemeinen Zeitung – mit einem kritischen Beitrag von Klaus Ceynowa über die an der Deutschen Nationalbibliothek (DNB) betriebene maschinelle Indexierung.[4] Eine automatisierte Vergabe von Schlagwörtern ist an sich nichts Neues – man denke an die MILOS-Projekte der 1990er-Jahre oder die Plattform dandelon.com. Netzpublikationen werden schon seit 2014 von der DNB automatisiert verschlagwortet. Neu ist jedoch, dass das Verfahren auch bei Printausgaben angewendet wird (zunächst in den Reihen B und H), und dass die DNB das Ziel formulierte, die Sacherschließung in den nächsten Jahren weitestgehend auf automatische Methoden umzustellen. Damit könnten – so die Hoffnung – endlich alle Ressourcen sachlich erschlossen werden, auch auf der Ebene von einzelnen Kapiteln oder Aufsätzen.

Skeptiker werden auf andere Entwicklungen verwiesen, die man sich vor wenigen Jahren nicht hätte träumen lassen. In der Tat führt die Kombination von Big Data mit künstlicher Intelligenz und maschinellem Lernen dazu, dass Maschinen Nachrichtenmeldungen schreiben, an der Börse handeln und Krebs diagnostizieren können – warum also nicht auch Schlagwörter vergeben? Doch zumindest derzeit lehrt die Realität etwas anderes, denn die Ergebnisse der eingesetzten Software sind mehr als dürftig (insbesondere dann, wenn sie nur auf Titel und Inhaltsverzeichnis basieren). Die Texte werden computerlinguistisch vorbehandelt und mit der GND abgeglichen, um passende Schlagwörter zu ermitteln. Häufig werden dabei wichtige Konzepte nicht erkannt beziehungsweise falsch zugeordnet. Auf der anderen Seite hält die Software mancherlei für ein Thema, was eine ganz andere Funktion hat.

Einige Beispiele: Eine Festschrift »125 Jahre Schwäbischer Albverein Ortsgruppe Crailsheim« erhielt unter anderem die Schlagwörter »Crailsheim« (immerhin!) und »Ortsverein« – aber nicht »Schwäbischer Albverein«. Für einen Führer durch eine Kasseler Gemäldegalerie (»Provenienzgeschichten : Gemäldegalerie Alte Meister Schloss Wilhelmshöhe«) bietet uns die Software »Geschoss «, »Meister«, »Gemäldegalerie« und »Spanisch«. Auch hier wurde die Körperschaft nicht erkannt (nicht einmal der Ort wird angegeben), und der zentrale Aspekt (die Herkunft der Gemälde) fehlt. Das verblüffende »Geschoss « erklärt sich beim Blick ins Inhaltsverzeichnis: Der Band ist nach den Stockwerken gegliedert (»1. Etage«, »2. Etage« …)! Auch Formulierungen wie »spanische Meister« versteht die Maschine nicht und macht daraus »Spanisch« und »Meister«.

Immer wieder lässt sich der Algorithmus aufs Glatteis führen: Beim Titel »Voller Esprit und Wissensdurst : Herzogin Luise Dorothea von Sachsen-Gotha-Altenburg (1710-1767)« wurde unter anderem »Esprit« und »Wissbegier« ausgegeben. Bei einem anderen Beispiel führten die Kapitelüberschriften »Kleine Geschichte in Jahreszahlen« und »Literatur zum Thema« zu den Schlagwörtern »Jahreszahl«, »Literatur« und »Thema«. Häufig landen auch Autoren von Beiträgen bei den Schlagwörtern. Der Computer kommt also nicht annähernd an die Inhaltsanalyse durch einen Menschen heran. Ob sich hier in den nächsten Jahren durchschlagende Änderungen ergeben werden, bleibt abzuwarten.

Eine Alternative zur Vollautomatisierung stellen Werkzeuge wie der Digitale Assistent (DA) dar, die die intellektuelle Erschließung mit maschinellen Methoden unterstützen.[5] Für einen zu bearbeitenden Titel zeigt der DA einerseits bereits vorhandene Erschließungen aus den deutschsprachigen Verbundkatalogen als Vorschläge an. Auch Schlagwörter aus internationalen Systemen werden dabei in GND-Schlagwörter »übersetzt«. Zum anderen wird automatisch nach ähnlichen Titeln gesucht, deren Erschließung unter Umständen nachgenutzt werden kann.

Alte und neue Baustellen

Die RSWK sind bisher für die intellektuelle Erschließung optimiert. Wenn die maschinelle Indexierung künftig eine größere Rolle spielen soll, werden Anpassungen nötig sein. Aber auch aus anderen Gründen kann eine Flexibilisierung der Regeln sinnvoll sein: Beispielsweise ist die Datenhaltung und der Austausch von Schlagwortfolgen problematisch, wenn ausschließlich mit den internationalen Feldern von MARC 21 gearbeitet wird. Manche Anwender wünschen sich auch die Möglichkeit, eine etwas gröbere Verschlagwortung zu praktizieren, also vom RSWK-Prinzip des präzisen Schlagworts abweichen zu können. Denkbar wären künftig verschiedene, klar definierte Anwendungsprofile. Für bestimmte Bereiche ihres Bestands könnte eine Bibliothek zum Beispiel eine intellektuelle Feinerschließung durchführen, für andere eine Groberschließung und für den Rest nur eine maschinelle Indexierung. Um weiterhin Austausch und Nachnutzung zu ermöglichen, müsste bei den Schlagwörtern jeweils auch angegeben sein, welcher Qualitätsstufe sie entsprechen. Die Idee solcher flexiblen Anwendungsprofile hat durchaus Charme – birgt freilich auch die Gefahr, dass derselbe Titel mehrfach auf unterschiedlichen Qualitätsstufen erschlossen wird (mit Nachteilen für die Arbeitseffizienz und das Retrieval) oder dass es zu einer Nivellierung nach unten kommt.

Es ist zu hoffen, dass bei der Weiterentwicklung der RSWK auch Lösungen für einige lang bekannte Desiderate gefunden werden – beispielsweise für die Abbildung der zeitlichen Dimension. Die derzeit vorgesehenen Zeitschlagwörter waren unter den Bedingungen eines Zettelkatalogs angemessen, weil sie dort nur eine Anzeigefunktion erfüllen mussten. In Online-Katalogen möchte man jedoch auch gezielt nach einem Zeitabschnitt suchen oder eine Trefferliste zeitlich einschränken können – dafür sind die Zeitschlagwörter nicht geeignet.

Aber es gibt auch ganz neue Ideen für einen zeitgemäßeren Einsatz der bestehenden Erschließungswerkzeuge. Auch dafür ein Beispiel: In jüngerer Vergangenheit konnte in einigen Verbünden der Anteil an sacherschlossenen Titeln mit einem innovativen Verfahren deutlich erhöht werden. Über einen entsprechenden Algorithmus wurden alle Titeldatensätze, die zu Ausgaben desselben Werks gehören, zu einem Cluster zusammengeführt. Innerhalb dieses Clusters wurde dann die Sacherschließungsinformationen gepoolt, das heißt zwischen den Manifestationen ausgetauscht[6]. Künftig wäre es denkbar, einen Schritt weiterzugehen und Schlagwörter oder Notationen von vorneherein nicht mehr beim Titeldatensatz zu erfassen, sondern beim Normdatensatz für das zugehörige Werk. Damit würde man auch dem FRBR-Konzept einen Schritt näher kommen.

Schließlich müssten sich endlich auch die Recherchesysteme deutlich weiterentwickeln. Denn bisher sind viele gut durchdachte Aspekte der RSWK technisch nicht oder nicht befriedigend implementiert. Beispielsweise gibt es in den meisten Online-Katalogen keine komfortable Möglichkeit, um sich bei einer Recherche nach einem Schlagwort auch die Treffer zu verwandten oder hierarchisch untergeordneten Begriffen anzeigen zu lassen – obwohl diese Informationen routinemäßig in der GND erfasst werden.

Ausblick

Die verbale Erschließung blickt auf eine lange Tradition zurück, hat jedoch weiterhin Zukunft – sofern ihre Regeln und Methoden regelmäßig evaluiert und an veränderte Bedürfnisse angepasst werden. Allerdings muss dies mit Augenmaß geschehen, um die Kontinuität und Nachhaltigkeit der Erschließung zu sichern – ein gewisser »Spagat« ist hier unvermeidlich.

Außerdem genügt es heutzutage nicht mehr, die inhaltliche Erschließung auf »verbal versus klassifikatorisch« zu reduzieren. Spätestens seit der Erfindung der Recommendersysteme wissen wir, dass es auch ganz andere Wege gibt, um Nutzerinnen und Nutzer zu den für sie relevanten Ressourcen zu bringen. Die Digitalisierung schafft neue Optionen, um unser Methodenrepertoire zu erweitern. Inhaltliche Zusammenhänge können etwa auch aus Zitationsbeziehungen abgeleitet werden: Werden in zwei Ressourcen häufig dieselben Werke zitiert, so ist anzunehmen, dass die Ressourcen dasselbe Thema behandeln. Eine manuelle Auswertung von Literaturverzeichnissen wäre natürlich nicht leistbar. Doch bereits jetzt steht ein großer Fundus von Zitationsdaten digital und frei zur Verfügung, auf dem neuartige Tools aufsetzen könnten.[7]

Will man im Interesse unserer Nutzerinnen und Nutzer ein gutes Gesamtergebnis bei der Sacherschließung erreichen, so wird künftig ein ausgewogener und durchdachter Mix von unterschiedlichen Methoden – und von intellektueller ebenso wie automatischer Erschließung – nötig sein.

Heidrun Wiesenmüller / 2.1.2018

 

Die Autorin

Professorin Heidrun Wiesenmüller M.A., geboren 1968 in Nürnberg, studierte Mittlere Geschichte, Anglistik und Mittellatein in Erlangen und Newcastle upon Tyne. Nach dem Referendariat an der Landesbibliothek Oldenburg und der FH Köln war sie zunächst als Fachreferentin an der Württembergischen Landesbibliothek tätig. Seit 2006 lehrt sie Formal- und Sacherschließung an der Hochschule der Medien in Stuttgart. Sie ist Mitglied verschiedener regionaler und überregionaler Fachgremien, darunter auch der Fachgruppe Erschließung des Standardisierungsausschusses. – Kontakt: wiesenmueller@hdm-stuttgart.de

 

[1.] Regeln für die Schlagwortkatalogisierung. 4., vollständig überarbeitete Auflage. Leipzig, Frankfurt am Main: Deutsche  Nationalbibliothek, 2017. http://nbn-resolving.de/urn:nbn:de:101-2017011305

[2.] Vgl. Esther Scheven und Barbara Pfeifer: Zusammenarbeit zwischen Formalerschließung und Inhaltserschließung am Beispiel der Formangaben. Vortrag auf dem 104. Deutschen Bibliothekartag in Nürnberg am 28.5.2015, http://nbn-resolving.de/urn:nbn:de:0290-opus4-19828

[3.] Vgl. Heidrun Wiesenmüller: Sacherschließung unter FRBR und RDA in Theorie und Praxis. In: o-bib 3(2016)3, S. 24-53, https://doi.org/10.5282/o-bib/2016H3S24-53

[4.] Klaus Ceynowa: In Frankfurt lesen jetzt zuerst Maschinen. In: FAZ vom 31.7.2017, S. 12, www.faz.net/-gqz-909kq. Vgl. Heidrun Wiesenmüller: Das neue Sacherschließungskonzept der DNB in der FAZ, Blogbeitrag vom 2.8.2017,

https://www.basiswissen-rda.de/neues-sacherschliessungskonzept-faz/

[5.] Vgl. Heidrun Wiesenmüller und Imma Hinrichs: Computerunterstützte Inhaltserschließung. Bericht über einen Workshop an der UB Stuttgart. In: o-bib 4(2017)3, S. 94-105, https://doi.org/10.5282/o-bib/2017H3S94-105

[6.] Vgl. Magnus Pfeffer: Using clustering across union catalogues to enrich entries with indexing information. In: Data analysis, machine learning and knowledge discovery. Edited by Myra Spiliopoulou, Lars Schmidt-Thieme, Ruth Janning. Cham: Springer, 2014, S. 437-445, https://doi.org/10.1007/978-3-319-01595-8_47

[7.] Vgl. Annette Klein: Von der Schneeflocke zur Lawine: Möglichkeiten der Nutzung freier Zitationsdaten in Bibliotheken. In: o-bib 4(2017)4, S. 127-136, https://doi.org/10.5282/o-bib/2017H4S127-136

 

Interessantes Thema?

Teilen Sie diesen Artikel mit Kolleginnen und Kollegen:

Nach oben