Skriv här det du söker efter!

Aktuellt

Aktuellt

Biblioteksverksamhet- ens hjärta byter form – ÅAB:s gamla kortkatalog blir digital

Åbo Akademis bibliotek har en kortkatalog som innehåller information om över en halv miljon verk, många sällsynta och värdefulla. Länge har informationen om dem varit tillgänglig endast för dem som förstår sig på en gammaldags kortkatalog, men nu finns hela katalogen också tillgänglig digitalt.

Kortkatalogen, som innehåller information om material fram till 1979, är uppbyggd av ett avancerat kortsystem. Huvudkort, eller huvuduppslag, är det huvudsakliga sökelement som används då man vill hitta ett verk. Om verket har en författare är huvuduppslaget författarens efternamn. Ett bikort, eller biuppslag, är verkets titel. Man har även kunnat slå upp verk utgående från ämnesord.

Bikort

Maskinskrivet katalogkort med handskrivna tillägg

–  Korten är väldigt systematiskt skrivna om man beaktar att de skrevs före datorernas tid; det fanns väldigt tydliga regler kring hur det skulle stå, inte minst när det gällde mellanslag och skiljetecken. Det var ju ett analogt informationssystem, väldigt avancerat. De ursprungliga korten i katalogen är skrivna för hand, men de flesta korten är skrivna på skrivmaskin. I Boktornet fanns det i den nyare delen byggd 1958 till och med ett rum som hette maskinskrivningssalen. Arbetet med kortkatalogen har varit både omfattande och till stor del manuellt, berättar överbibliotekarie Yrsa Neuman.

Pia Backman och Yrsa Neuman, ÅAB.
Pia Backman och Yrsa Neuman framför den fysiska kortkatalogen i Boktornets andra våning.

Trots att den alfabetiska kortkatalogen hela tiden varit tillgänglig att användas av kunderna är det få som gjort det eftersom systemet med kort inte lärts ut och använts på många årtionden. På grund av detta har stora delar av bibliotekets äldre material länge varit outforskat av de flesta.

– För att underlätta för våra kunder som vill veta vad vi egentligen har i våra samlingar, särskilt det äldre materialet, digitaliserar vi nu kortkatalogen för att göra den tillgängliga för alla. Det är ändå en stor del av våra samlingar som ingen egentligen vet om att existerar då den informationen inte är sökbar på internet, säger Pia Backman, katalogansvarig vid Åbo Akademis bibliotek.

Boktornet
Kortkatalogen har tidigare funnits i Boktornets nedre våning, bilden är tagen 1958. Källa: Åbo Akademis bildsamlingar, foto: Kameraboden.

 

Mångårigt projekt

Arbetet med att digitalisera kortkatalogen påbörjades redan för flera år sedan, då under något andra former. En handfull anställda vid biblioteket arbetade med att mata in informationen från korten för hand i den digitala katalogen.

– De blev inte färdiga, det tog helt enkelt för länge och det projektet avslutades. De kom så långt som till bokstaven L, det vill säga ungefär halva kortkatalogen. Med den farten kan vi kanske räkna med att det skulle ha tagit omkring tio år att få hela kortkatalogen inskriven. Så då jag började som chef vid ÅAB 2021 tänkte jag att återstoden av jobbet lämpade sig som digitaliseringsprojekt, säger Neuman.

Sagt och gjort, det nya digitaliseringsprojektet påbörjades hösten 2021 med stöd av dåvarande rektors strategiska medel från Stiftelsen för Åbo Akademi. Den första fasen gick ut på att manuellt plocka ut korten som skulle skannas.

Kortkatalog i ÅAB
Huvudkorten är fortfarande tillgängliga för kunderna och finns i kortkatalogen på andra våningen i Boktornet.

– Bikorten plockades bort för vi tänkte att det endast behövdes en instans av varje verk i våra samlingar, annars skulle vi bli tvungna att först låta skanna dem och sen ta bort dubbletterna. Så nu finns huvudkorten och bikorten i skilda kataloger. Huvudkorten är fortfarande tillgängliga för kunderna på andra våningen i Boktornet, men de är packade väldigt tätt så de kan vara något svåra att bläddra bland, förklarar Neuman.

Att plocka ut korten ur katalogen pågick fram till våren 2022. Efter det var det dags för nästa steg, nämligen skanningen och textigenkänningen. Men innan den processen kunde påbörjas var det många bitar som måste falla på plats, inte minst logistiskt.

Lådor med katalogkort
Det var många lådor med katalogkort som skickades till Sverige för skanning.

– Den främsta regeln då det gäller kortkatalogen är ju att korten inte får tas ut ur skåpet, annars går hela systemet förlorat. Så vi funderade mycket på hur vi skulle gå till väga. Vi testade att skicka hela möbeln med innehåll men det var alldeles för besvärligt. Till sist blev det så att vi skickade kortlådorna nerpackade i flyttlådor, förklarar Backman.

Lika viktigt var att korten skulle komma tillbaka i samma ordning som de skickats eftersom korten behövde vara i rätt ordning för att man ska kunna jämföra dem med de digitala filerna.

– Korten är vårt facit så det skulle vara verkligt illa om något hände dem. Om vi skulle förlora 200 000 kort har vi upp till 200 000 böcker i våra lager som vi inte vet vad eller var de är. Det skulle vara enormt dyrt att börja leta igenom då vi har totalt 52 hyllkilometer analogt material, så vi kunde inte riskera det, säger Neuman.

– Det har varit en lång planeringsfas där vi funderat över vad det är för typ av information och filer vi behöver. Informationen som finns på korten varierar, i vissa fall har till exempel tilläggsinformation skrivits in med penna på maskinskrivna kort i efterhand, så det är inte så lätt att få strukturerade data från korten, säger Backman.

Maskinskrivet katalogkort med handskrivna tillägg
Maskinskrivet katalogkort med handskriven tillägginformation.

Totalt handlade det om över 215 000 kort som skulle skannas, från bokstaven L till Ö, vilket är ungefär halva katalogen. Uppgiften att skanna korten gick till ett företag i Södertälje, Sverige som skannade dem i en särskild rotationsskanner. Skanningsprocessen pågick mellan hösten 2022 och våren 2023. De maskinskrivna korten och en del av de handskrivna korten skannades in och konverterades till bilder och filer som innehåller kortens information. Den maskinskrivna texten transkriberades sedan med hjälp av OCR (Optical Character Recognition), en teknik där man med hjälp av bildanalys omvandlar digitala bilder av tryckt text till bokstäver och siffror som andra program, exempelvis ordbehandlare, kan läsa. En del handskriven text ska även transkriberas. På detta sätt får man strukturerad data som är sökbar, så att kunderna kan söka på bland annat titel och författare.

 

Handskriven text behandlas med AI

Största delen av korten innehåller information som är skriven på maskin och upplagd likadant vilket gör att texten kan skannas systematiskt. Men det finns en del kort med handskriven text som inte kan behandlas på samma sätt. Här kommer Laleh Davoodi, doktorand inom informationssystem vid Åbo Akademi, in i bilden. Tillsammans med handledare Jozsef Mezei, professor i informationssystem, har Davoodi till uppgift är att känna igen resten av de handskrivna bilderna på varje kort och omvandla dem till text med hjälp av AI.

Handskrivet bibliotekskort, ÅAB.
De ursprungliga korten i katalogen är skrivna för hand.

– Vi håller på att skapa två modeller för maskininlärning. Först ska vi skapa ett dataset från de handskrivna bilderna (hand-written images eller HWI) som vi redan har motsvarande text för som vi fått av det svenska företaget. Med hjälp av det här datasetet tränas en modell för handskriftsigenkänning (handwritten recognition model- HRM) för att omvandla de handskrivna bilderna till text. Nästa steg är att göra en binär bildklassifikator (Binary Image Classifier- BIC) som ska känna igen maskinskrivna respektive handskrivna bilder. Därpå följande steg är att identifiera de handskrivna bilderna på varje kort med hjälp av BIC-modellen. Till sist ska vi mata in de handskrivna bilderna i handskriftigenkänningsmodellen (HRM) som indata för att förutsäga deras text, förklarar Davoodi.

– Vi var väldigt glada över att få ha forskare med i projektet och Lalehs kunnande var nyttigt för oss på flera nivåer. Hon hjälpte oss också med att hantera katalogkort som avvek från standarddatamodellerna och så kunde hennes arbete användas för att hitta kort som markerats ”A” för hand, vilket betydde att de redan överförts till vår katalog Alma, säger Neuman.

 

Tillgänglig för alla

De sista av korten skannades in och skickades tillbaka till biblioteket våren 2023. Under våren har biblioteket också samarbetat med systemplaneraren Tuomo Toljamo som jobbat med att installera och konfigurera den nya digitala plattformen DSpace och med IT-planeraren Andreas Söderlund som varit med och planerat projektet från början.

– Det här är ett projekt vi har tillsammans med ICT-service. Det kostar ett sexsiffrigt belopp att utföra, men att göra det som ett digiprojekt kostar en tredjedel av vad det skulle ha gjort om vi hade fortsatt att jobba på det gamla sättet och manuellt matat in korten i systemet. Arbetstiden och den fysiska arbetsbördan har också minskat drastiskt, säger Neuman.

Det fina är ju att vi får dela med oss av det här, att vem som helst kan ha nytta av den

De digitala katalogkorten finns till en början tillgängliga för bibliotekspersonalen på en skild plattform, både som text (s.k. bibliografiska metadata) och bild, och är sökbara för alla genom bibliotekets sökdatabas Alma. I projektets nästa fas skapas MARC-poster för materialet i bibliotekssystemet Alma. MARC som står för Machine Readable Cataloging är det format som används i bibliotekssystemet av biblioteken.

Rar bok ur ÅABs samlingar
En av de böcker som ingår i ÅAB:s specialsamlingar. Informationen om boken fanns bara på ett fysiskt katalogkort men är nu tillgänglig i den nya digitala katalogen. Boken på bilden är tryckt på 1500-talet i Tyskland och är skriven på latin.

Genom Alma kommer informationen från korten även att kunna överföras och göras öppet tillgänglig för alla genom databasen Melinda, som är en nationell samarbetsmiljö för bibliografisk beskrivning och en nationell plattform för metadata som samlar beskrivande metadata om material från olika bibliotek på ettoch samma ställe.

– Det fina är ju att vi får dela med oss av det här. Då katalogen finns på plattformen och tillgängligt för våra kunder och i framtiden också i vår egen Alma-databas kan vi skicka informationen vidare till databasen Melinda och då är ju den tillgänglig gratis så att vem som helst kan ha nytta av den och se vad vi har, berättar Backman.

Projektet är verkligen viktigt kulturhistoriskt sett: det visar vilka fantastiska samlingar ÅA har.

– Utan det här projektet skulle de här böckerna kunna ses som ganska värdelösa. Får vi inte fram informationen på korten så lagrar vi egentligen bara 200 000 böcker som våra kunder inte kan nå. Bland de här böckerna finns det också sådana verk som ingår i våra rara samlingar, så projektet är verkligen viktigt kulturhistoriskt sett: det visar vilka fantastiska samlingar ÅA har. Vi har därtill kort i katalogen som är från bibliotekets början. De representerar olika delar av verksamhetens historia och det känns fint att flera nu kan ta del av en bit bibliotekshistoria samtidigt, säger Neuman.

 

Du kan söka i och bekanta dig med den digitala kortkatalogen här!