Biblioteki cyfrowe w Polsce

Biblioteki cyfrowe w Polsce — ważne źródło informacji

Biblioteki cyfrowe w Polsce działają od dłuższego czasu. Dla mnie są wielką skarbnicą informacji na temat moich przodków oraz czasów, w których żyli. Znajduje je głównie w gazetach, ale także trafia się literatura faktu (pamiętniki, wspomnienia). Przewodniki oraz książki teleadresowe również często są doskonałym źródłem wiedzy, a pocztówki i grafiki świetnym i darmowym materiałem do ilustrowania wpisów. Biblioteki cyfrowe w Polsce dysponują również dużymi zasobami literatury pięknej, książkami, które nie doczekały się wznowień w ciągu ostatnich kilkudziesięciu lat.

Biblioteki cyfrowe a tradycyjne

Biblioteki cyfrowe w Polsce głównie zawierają dzieła autorów, którzy zmarli ponad 70 lat temu, a gdy autor nie jest znany (np. gazety) 70 lat od momentu gdy utwór został wydany czy wykonany. Wynika to z praw autorskich obowiązujących w Polsce. Dzieła objęte prawami autorskimi, nawet jeżeli zastały zeskanowane i umieszczone w bibliotece cyfrowej, nie są dostępne przez Internet. Część twórców lub właścicieli praw autorskich zrzeka się swoich praw i dzięki temu również nowsze dokumenty możemy przeglądać z domu. Przykładowo dzięki umowie licencyjnej udzielonej przez Spółdzielnię Wydawniczą Czytelnik Mazowiecka biblioteka cyfrowa udostępnia dziennik „Życie Warszawy” z lat 1946-1958.  Skarb Państwa, właścicielem praw do czasopisma „Stolicy” udzielił również tej bibliotece prawo udostępniania numerów archiwalnych z lat 1946-1989.

Poszukiwanie czegoś ciekawego w bibliotece cyfrowej całkowicie różni się od biblioteki tradycyjnej. Oczywiście w obu są katalogi osobowe, tematyczne, a także „półka” z nowościami. Można spróbować wyszukać książkę po haśle. Jednak trzeba dobrze je przemyśleć i znać słowa kluczowe obowiązujące w danej bibliotece.

Przykładowo Polonie (największej bibliotece cyfrowej) wyszukanie po haśle „kryminał” daje w rezultacie jedynie jeden artykuł i to po rosyjsku, ale nie pokazuje serii książek Maurice Leblanc o dżentelmenie włamywaczu Arsenie (Arseniuszu) Lupin. Trzeba je znaleźć po nazwisku autora lub tytule lub w ogólnym dziale literatura francuska (w sumie zeskanowanych prawie 2,5 tys. książek z tego 1941 po polsku). Niestety, Arthura Conana Doyle jest tylko jedna książka i to biograficzna, więc na Polonie o przygodach Sherlocka Holmesa sobie nie poczytamy. Podobnie z przygodami Herkulesa Poirota. Ale nie o to chodzi w tych bibliotekach cyfrowych.

Znajdziemy tam różne perełki przez wszystkich zapomniane, jak wspomnianego Arsena Lupin, i wiele innych niewznawianych po 1945 roku pozycji. Pod hasłem powieść polska w Polonie jest dostępnych ponad 160 książek. Dla mnie jednym z najciekawszych znalezisk były wspomnienia Henryka Glassa Na szlaku chudego wilka z podziemi ku Polsce, gdzie dużo miejsca poświęcone jest bratu wujecznemu mojego Pradziadka Bolesławowi Polkowskiemu.

Biblioteki cyfrowe w Polsce książki dla dzieci
Źródło: Polona

Dla historyków (rodzin, regionów) ważnym źródłem informacji są gazety. W bibliotekach cyfrowych jest ich cała masa, bo polska prasa była wydawana nieprzerwanie od XVIII wieku. Można je przeglądać dzień po dniu, rocznik po roczniku lub wyszukiwać w nich pojedyncze wyrazy czy nawet całe frazy. Jakość wyszukiwania zależy od używanego oprogramowania oraz jakości OCRu (programów do optycznego rozpoznawania znaków). Niektóre pozycje są dostępne w kilku bibliotekach, więc warto szukać w kilku miejscach. Przykładowo Kurjer Warszawski (najdłużej wychodząca gazeta w Polsce) jest dostępny w bibliotekach cyfrowych Biblioteki Narodowej, Uniwersytetu Warszawskiego oraz Uniwersytetu Jagielońskiego.

Biblioteki cyfrowe w Polsce gazety
Besarabia, okopy, Stanisław Jankowski autor wzoru, Źródło: Polona

W bibliotekach cyfrowych dostępne są dostępne także pisma satyryczne. Czasami humor w nich przedstawiany nie jest obecnie czytelny lub można uznać za dość niskich lotów. Jednak zawsze pozwala bliżej przyjrzeć się realiom poznawanej epoki.

Na jakim oprogramowaniu działają biblioteki cyfrowe

W końcówce ubiegłego wieku, gdy zaczynały powstawać biblioteki cyfrowe, łącza Internetowe miały małą przepustowość. Dlatego do stworzenia polskiego środowiska służącego budowie bibliotek cyfrowych zdecydowano się użyć ówcześnie najbardziej efektywny pod względem kompresji danych format DjVu. Drugą cechą tego formatu była duża ilość darmowych rozszerzeń.

Z biegiem lat Internet stał się znacznie szybszy, a darmowe rozszerzenia przestały być obsługiwane przez przeglądarki ze względu na podatność na wirusy. Zrobiono zaślepkę (co prawda mocno ułomną) umożliwiająca obsługująca format DjVu, więc nadal możliwe jest korzystanie z setek tysięcy wcześniej zeskanowanych dokumentów.

Nowe wersje systemu dLibra (Digital Library Framework) pozwalają korzystać z plików w „normalnym” formacie, czyli PDF, ale nie nadal cierpią na grzech pierworodny: wyszukiwanie jest dwuetapowe. Najpierw pokazywane są publikacje, w których dane słowo występuje, a po wybraniu publikacji trzeba znów poszukać danego słowa w dokumencie. Jest to niezbyt wygodne. Nic więc dziwnego, że na przykład Biblioteka cyfrowa Uniwersytetu Warszawskiego zaczęła budowę własnego systemu Crispa. Niestety, nie jest to jeszcze dopracowany system i niespecjalnie nadaje się do wyszukiwania. W Polsce niedoścignionym wzorem jest Polona, ale i ona mniej wygodna niż biblioteka cyfrowa gazet z terenu Austro-Węgier: ANNO – AustriaN Newspapers Online. Jest on tak intuicyjny, że opis jak tam prowadzić poszukiwania nie jest potrzebny. Dodatkowo, po uruchomieniu tłumaczenia stron, zrozumienie czy coś jest interesującego w niemieckich czy węgierskich gazetach, nie stanowiło dla mnie problemu, mimo że nie znam tych języków.

FBC — Federacja Bibliotek Cyfrowych

Znając tytuł poszukiwanej pozycji, autora czy słowa kluczowe, można w jednym miejscy wyszukać, czy znajdziemy coś w zasobach wszystkich polskich bibliotek cyfrowych, a jest ich 140. Wystarczy wejść na stronę Federacji Bibliotek Cyfrowych i użyć wyszukiwarki prostej lub zaawansowanej. Wyszukiwarka ta nie oferuje jednak przeszukiwania treści dokumentów.

Na stronach FBC można też znaleźć zestawienie wszystkich bibliotek, liczbę obiektów dostępnych w otwartym zasobie, których jest obecnie ponad 5 milionów (z czego zdecydowana większość stanowią czasopisma). Największą biblioteką cyfrową jest Biblioteka Cyfrowa Biblioteki Narodowej Polona (dlatego poświęciłem jej oddzielny wpis). Zawiera ona już prawie 3 miliony obiektów. Następna jest Jagiellońska Biblioteka Cyfrowa (Uniwersytet Jagieloński) z 747 tys. obiektów, a na trzecim miejscu Śląska Biblioteka Cyfrowa z liczbą przekraczająca 400 tys. Poza „pudłem”, na czwartym miejscu znalazła się Crispa – biblioteka cyfrowa Uniwersytetu Warszawskiego.

Warto przeszukiwać wszystkie biblioteki, bo mogą się w nich trafić zupełnie niespodziewane znaleziska. Przykładowo w Biblioteka Cyfrowa Politechniki Warszawskiej znalazłem „Przyczynek do historyi zboru ewangelicko augsburskiego warszawskiego 1650-1781” napisany w 1881 roku przez pastora Leopolda Otto, który jest przydatnym dokumentów w poszukiwaniach ewangelików warszawskich.

Biblioteki cyfrowe są dla mnie jednym z najważniejszych źródeł, w których znajduje informacje o moich przodkach, dalszej rodzinie i ich sąsiadach, znajomych i współpracownikach.

1 thought on “Biblioteki cyfrowe w Polsce — ważne źródło informacji”

  1. Aneta Balcerkiewicz

    Bez tych bibliotek moja wiedza o rodzinie byłaby prawie zerowa. Czas w nich spędzony to czas dobrze wykorzystany.

Leave a Comment

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *