Katalogi przyspieszają, gdy zebry odpoczywają

Herbert Aust z Pixabay

Wraz z aktualizacją z wersji 21.11 do 22.11 oddajemy do użytku system Koha z silnikiem wyszukiwawczym ElasticSearch, uwzględniający wymagania i możliwości współpracy z NUKAT.


Na przełomie 2022 i 2023 r. w Bibliotece trwały intensywne prace przygotowujące technologiczne zmiany w systemie bibliotecznym. Tegoroczne Święto Uczelni – 10 marca 2023 r. – to dobry moment, by ich efekty ujrzały światło dzienne.

Mamy powody do dumy, bo nasz katalog to jedna z pierwszych “elasticowych” instalacji Koha w Polsce, po Katalogu bibliotek dominikańskich w Polsce i równocześnie z Centralnym Katalogiem Bibliotek “Fides”. Taką przynajmniej – że jesteśmy na podium – mamy nadzieję, na podstawie znajomości środowiska bibliotecznego.

Szybsze wyszukiwanie

Zanim przejdziemy do charakterystyki prowadzonych prac, warto odnotować korzyści jakie wypływają z opisywanych zmian. Pierwszą z nich – tą najbardziej widoczną w codziennym korzystaniu z katalogu – jest szybsze wyszukiwanie. ElasticSearch radzi sobie znacznie lepiej niż Zebra. W poniższym nagraniu ilustrujemy to na przykładzie kilku wyszukiwań.

Koha – szybkość wyszukiwania: Zebra vs ElasticSearch

Wzbogacony zestaw faset

Od uruchomienia Koha w 2019 r. używaliśmy standardowego zestawu faset, w którym znajdowały się: Autor, Biblioteka, Lokalizacja, Miejsce, Seria, Temat, Typ dokumentu, Tytuł. Teraz zestaw ten jest znacznie poszerzony i obejmuje dodatkowo: Dzieło, Gatunek, Język, Odbiorca, Rok wydania, Temat: Czas, Temat: Dzieło, Temat: Miejsce, Temat: Nazwa. Wzorujemy się w tym względzie na doświadczeniach wspomnianych już bibliotek dominikańskich oraz “Fides”.

Dlaczego dopiero teraz poszerzamy zestaw faset?

Przede wszystkim z powodu jakości danych w naszym katalogu. Po wdrożeniu Koha zdecydowaliśmy poczekać z uzupełnieniem zestawu do czasu, gdy wymienimy większość rekordów lokalnych na rekordy z NUKAT. Jakość danych ma bowiem kluczowe znaczenie dla zawartości i użyteczności faset. Kolejnym czynnikiem była obawa o znaczny spadek wydajności systemu. Testy przeprowadzone w 2022 r. jednoznacznie wskazywały, że dodanie dużej grupy faset istotnie spowolni działanie katalogu. Jednocześnie pojawiło się rozwiązanie tego problemu – zmiana silnika wyszukiwawczego na ElasticSearch.

Ogólna charakterystyka prac

Najpierw zauważmy, że Koha obsługuje standardowo dwa silniki wyszukiwania: Zebra i ElasticSearch. Domyślnie uruchamiana jest Zebra, ES jest opcją, na jaką można się przełączyć. Taka zmiana oznacza oczywiście przekonfigurowanie ustawień oraz uruchomienie odpowiednich usług w systemie. Chodzi przede wszystkim o sposób indeksowania danych.

Druga sprawa to współpraca Koha z NUKAT. Zależało nam na utrzymaniu dotychczasowego rozwiązania, które automatyzuje tę współpracę od strony informatycznej. Efekty tego rozwiązania są widoczne także dla użytkowników katalogu – i nie chodzi tylko o aktualność danych, ale także ułatwienia w nawigacji i prezentowaniu informacji.

Trzeci temat – stosunkowo standardowy – to rozwój oprogramowania, a więc modyfikacje w związku z kolejnymi wersjami systemu (dokumentowane przez społeczność Koha) oraz ich wpływ na stosowane lokalnie rozwiązania.

Z dumą możemy powiedzieć, że mamy swój wkład w rozwój systemu Koha – w minionych miesiącach udało się nam wykryć, zdiagnozować oraz zaproponować rozwiązania kilku bug-ów.