Analysetool MARCEL
Entwicklungsteam (alphabetisch geordnet): Jens Schwidder (Entwickler, seit 2010), Julia Alexandra Goltz (Fachberatung, seit 2011)
Kooperation: Die Software wurde im Rahmen der im Jahr 2007 geschlossenen Entwicklungspartnerschaft zwischen dem Bibliotheksverbund Bayern (BVB) und dem Kooperativen Bibliotheksverbund Berlin-Brandenburg (KOBV) entwickelt.
Kurzbeschreibung
MARCEL ist ein Java-gestütztes Software-Tool zur automatischen Daten- und Fehleranalyse von Bibliothekskatalogen.
Jeder Katalog enthält fehlerhafte Daten, die das Auffinden von vorhandenen Informationsmedien erschweren, im schlimmsten Fall sogar unmöglich machen. Derartige Fehler schleichen sich nicht beim direkten Katalogisierungsprozess ein. Hier werden sie beim Speichervorgang erkannt und das Abspeichern des Katalogisats verhindert. Bei Batcheinspielungen jedoch greift diese Prüfmethode oftmals nicht, so dass im Katalog Datensätze mit schweren Konsistenzfehlern vorhanden sind. Beispiele dafür sind fehlerhaft verknüpfte Daten (z.B. Bandsätze ohne übergeordneten Satz) oder fehlende Eingaben (Katalogisate ohne Titelangabe).
Basierend auf dem MARC-Datenaustauschformat ermöglicht Marcel derzeit die formale Prüfung von Katalogdaten verbunden mit einer statistischen Auswertung über die Verteilung der Felder. Dazu benötigt es einen MARC-Abzug des Katalogs im MARC21-Bandformat mit MARC21-Zeichensatz. Dieses Datenpaket wird innerhalb weniger Minuten analysiert. Als Ergebnis erhält man einen Report mit einer allgemeinen Statistik zu den geprüften Datensätzen (Verteilung der Satztypen, Anzahl der MAB-Felder, u.a.), sowie eine Liste gefundener Fehler. Die Software wird bei der Migration von Daten in das neue KOBV-Portal eingesetzt.
Verbunden mit einer Datenbank können weitere Informationen aus den Katalogdaten gezogen werden, z.B. Aussagen über die Verteilung von Print- vs. Digitalmedien im Bestand oder über die prozentuale sachliche und inhaltliche Erschließung.
Da die Testphase noch läuft, wurde das Tool MARCEL noch nicht publiziert – ein Release soll aber in Kürze erfolgen. Auf GitHub bietet die KOBV-Zentrale aber bereits jetzt einen Einblick in den Sourcecode.
→ Sourcecode der Software auf GitHub
Zielgruppe
MARCEL richtet sich an alle, die statistische Aussagen über Daten, die im Format MARC vorliegen, haben möchten.
Publikationen und Vorträge
keine
Ansprechpartner
Entwicklung und technische Beratung:
kobv-zt[at]zib.de