Przeszukaj Serwis Informacyjny FBC pro

Przeszukaj zbiory FBC

FBC >

Podstawy bibliotek cyfrowych

Co należy wiedzieć na temat bibliotek cyfrowych?

Czym jest biblioteka cyfrowa?

Biblioteki oferują swoim czytelnikom możliwość korzystania z różnorodnych zbiorów: książek, gazet, czasopism, itp. Czytelnik może wypożyczyć książkę, aby przeczytać ją później lub zrobić to na miejscu, w czytelni. Wzrost znaczenia Internetu i mediów elektronicznych spowodował pojawienie się nowych trendów w bibliotekarstwie. Z tym faktem wiąże się powstanie bibliotek cyfrowych, nazywanych także bibliotekami wirtualnymi lub elektronicznymi. Analogicznie do zwykłej biblioteki, biblioteka cyfrowa udostępnia swoim czytelnikom różne obiekty cyfrowe. Obiekt cyfrowy to cyfrowy odpowiednik (reprezentacja) książki, czasopisma lub innego obiektu przechowywanego w bibliotece. Użytkownik może ściągnąć dany obiekt do natychmiastowego lub późniejszego użycia, lub przejrzeć od razu w przeglądarce internetowej. Podsumowując, można stwierdzić, że biblioteka cyfrowa ma funkcje podobne to zwykłej biblioteki, ale bazuje nie na papierowych wersjach książek lub czasopism, tylko na ich cyfrowych reprezentacjach. Ilustracja 1. prezentuje przykładowy obiekt cyfrowy, wyświetlany w przeglądarce internetowej.1c
Ilustracja 1. Przykładowy obiekt cyfrowy z Wielkopolskiej Biblioteki Cyfrowej (zrzut ekranu Wielkopolskiej Biblioteki Cyfrowej).
Obiekt cyfrowy może reprezentować książkę, w tym nawet kilkutomowe dzieło (np. encyklopedię) lub czasopismo - pojedynczy numer lub cały jego rocznik. Podstawową ideą obiektów cyfrowych jest możliwość ich jednoznacznego zidentyfikowania. Oznacza to, że obiekt cyfrowy jest identyfikowany przez dane i metadane. Metadane muszą zawierać unikatowe identyfikatory pozwalające na identyfikację danego obiektu. Podczas gdy metadane (unikatowy identyfikator) pozwalają na identyfikację obiektu, dane (nazywane także zawartością) są nośnikiem treści i wartości intelektualnych. Przechodząc do szczegółów, należy dodać, że możliwe jest rozróżnienie w obiekcie cyfrowym następujących elementów:
  • unikatowy identyfikator
  • metadane
  • zawartość
Chociaż unikatowy identyfikator może być traktowany jako część metadanych, wart on jest szczególnej uwagi ze względu na jego znaczenie.
Biblioteki cyfrowe składają się przede wszystkim z obiektów cyfrowych, ale nie są to jedyne ich składniki. Biblioteki cyfrowe tworzą również ludzie, wyposażenie, systemy oprogramowania, procedury, zespoły ludzkie itp. Należy pamiętać, że biblioteka cyfrowa to nie tylko oprogramowanie z obiektami cyfrowymi, ale cały system organizacyjny, pozostający w tle lecz niezbędny dla funkcjonowania biblioteki.

Powody funkcjonowania bibliotek cyfrowych

Powody funkcjonowania bibliotek cyfrowych są ogólnie podobne do powodów funkcjonowania bibliotek jako instytucji kultury. Główne zadania bibliotek przedstawia poniższa ilustracja.
2c Ilustracja 2. Główne zadania bibliotek. Oczywiście nie wszystkie zadania bibliotek mogą być realizowane w pełni przez bibliotekę cyfrową, ale może ona doskonale wspomagać wykonywanie najważniejszych zadań, takich jak współdzielenie, katalogowanie i konserwację zbiorów. Wszystkie te zadania są realizowane za pośrednictwem Internetu. Poszukując potrzebnych materiałów, użytkownicy mogą przeglądać i przeszukiwać wspólne zasoby udostępniane przez bibliotekę cyfrową. Pracownicy, którzy dodają nowe obiekty cyfrowe do biblioteki cyfrowej mogą też tworzyć opisy bibliograficzne, a sama biblioteka cyfrowa może zajmować się długoterminową konserwacją i zachowaniem obiektów cyfrowych.
Generalnie, zadaniem biblioteki cyfrowej jest zapewnienie - za pośrednictwem Internetu - dostępu do materiałów przechowywanych na półkach bibliotecznych. Aby można to było zrobić należy wcześniej te materiały zdigitalizować, gdyż muszą one zaistnieć w formie cyfrowej. Dzięki dostępności materiałów bibliotecznych w formie cyfrowej w Internecie zyskują zarówno użytkownicy końcowi, jak i biblioteki.

Sposób działania biblioteki cyfrowej

Sposób działania biblioteki cyfrowej jest przedstawiony na poniższym schemacie.
3c
Ilustracja 3. Schemat organizacji pracy w bibliotece cyfrowej.
Ilustracja 3. przedstawia codzienny proces dodawania nowych obiektów cyfrowych do biblioteki cyfrowej. Załóżmy, że pewien pisarz napisał nową książkę. Książka została opublikowana, a jeden jej egzemplarz został nabyty przez bibliotekę. Biblioteka digitalizuje i kataloguje tę książkę. Po wykonaniu tych czynności biblioteka posiada obiekt cyfrowy. Obiekt ten jest następnie wprowadzany jest do oprogramowania biblioteki cyfrowej, która udostępnia go każdemu zainteresowanemu czytelnikowi. Proces ten może ulec skróceniu, jeśli autor przygotuje książkę w formie cyfrowej, w wyniku czego otrzymamy tzw. materiał natywnie cyfrowy (ang. born digital). W takim wypadku wystarczy jedynie skatalogować książkę i dodać ją do oprogramowania biblioteki cyfrowej.

Korzyści wynikające z użytkowania biblioteki cyfrowej

Istnieje wiele korzyści płynących z funkcjonowania bibliotek cyfrowych, istotnych zarówno dla czytelników, jak i dla samej biblioteki. Do najważniejszych można zaliczyć:
  • Dostęp do zasobów cyfrowych przez 24 godziny na dobę - biblioteka cyfrowa jest czynna cały czas, z wyjątkiem krótkich przerw na przeprowadzanie prac konserwacyjnych. Czytelnicy mogą ją odwiedzać o dowolnej porze i z dowolnego punktu na Ziemi, w którym jest dostęp do Internetu.
  • Łatwe przeszukiwanie i przeglądanie - biblioteki cyfrowe oferują czytelnikom możliwość korzystania z wyszukiwarek w celu znalezienia interesujących materiałów. Poza przeszukiwaniem metadanych, takich jak tytuł, autor, rok publikacji, możliwe jest także przeglądanie zasobów przygotowanych w formie alfabetycznych indeksów autorów, tytułów, haseł przedmiotowych, itp.
  • Przechowywanie materiałów cyfrowych - materiały cyfrowe są przechowywane na serwerach biblioteki cyfrowej i nigdy nie są z nich przenoszone. Za każdym razem, kiedy użytkownik wysyła do biblioteki zapytanie o konkretny obiekt cyfrowy, otrzymuje kopię tego obiektu przechowywaną na dysku twardym biblioteki cyfrowej. Oznacza to nie tylko zachowanie oryginalnego materiału cyfrowego, ale także nieograniczoną liczbę kopii, którą można uzyskać z oryginału - w przeciwieństwie do materiałów drukowanych, których ilość jest z oczywistych powodów ograniczona ilością dostępnych na półkach egzemplarzy.
  • Łatwość aktualizacji informacji - gdy zaistnieje potrzeba aktualizacji konkretnego obiektu cyfrowego, odpowiedzialni za to pracownicy zastąpią starą informację nową, dostępną natychmiast dla wszystkich czytelników. Tradycyjna biblioteka byłaby zmuszona nabyć nowe wydanie danego materiału lub dodać erratę.
  • Nowe formy informacji - możliwe staje się wykorzystanie nowych technologii do tworzenia nowych materiałów informacyjnych, takich jak interaktywne kursy, materiały multimedialne, itp.
  • Automatyczna wymiana informacji z zewnętrznymi systemami oprogramowania - biblioteka cyfrowa może automatycznie komunikować się z zewnętrznymi systemami oprogramowania i wymieniać dane na temat obiektów cyfrowych. Jeśli biblioteka przekazuje wyszukiwarkom internetowym informacje na temat obiektów cyfrowych, to wyszukiwarki są w stanie skierować użytkownika na stronę biblioteki cyfrowej za każdym razem, kiedy zapytanie użytkownika pokryje się z zawartością dostępną w takiej bibliotece.
Zyski dla czytelników to dostępność materiałów przez całą dobę, szybka aktualizacja informacji oraz możliwość przeszukiwania i przeglądania zasobów. Biblioteki cyfrowe zyskują coraz większą liczbę czytelników, a ich zasoby stają się coraz bardziej popularne. Ponadto ułatwiona jest również ich obsługa i zarządzanie zbiorami. Wszystkie te korzyści sprawiają, że biblioteki cyfrowe są ważnym elementem współczesnych społeczeństw.

Kto współdziała z biblioteką cyfrową?

Cyfrowa biblioteka współdziała z liczną grupą użytkowników, ale według typologii Otwartego Modelu Informacji Archiwalnej (ang. Open Archival Information System model, OAIS) należy wśród nich wyróżnić trzy kategorie. Są one przedstawione na ilustracji 4.
4c
Ilustracja 4. Kategorie użytkowników biblioteki cyfrowej.
Na ilustracji 4. pokazano trzy kategorie użytkowników: kierowników, twórców i użytkowników.
  • Kierownicy - określają strategie, zasady i procedury, które powinny być stosowane w bibliotece cyfrowej. Kierownictwo jest odpowiedzialne na przykład za ogólne określenie parametrów biblioteki, takich jak format przechowywanych obiektów cyfrowych (PDF, TXT, HTML, MP3, itp.), kolekcji, które mają być zdigitalizowane i udostępnione publicznie. Są też odpowiedzialni za ustalenie organizacji pracy w procesie digitalizacji, itp. Kierownictwo nie jest zaangażowane w codzienne czynności związane z działaniem biblioteki cyfrowej.
  • Twórcy - wyspecjalizowany personel odpowiedzialny za dodawanie nowych obiektów cyfrowych do biblioteki. Twórcy (nazywani również edytorami) są odpowiedzialni za digitalizację, przygotowanie plików do biblioteki cyfrowej, katalogowanie obiektów cyfrowych, przyznawanie praw dostępu do tych obiektów itp. Ogólnie mówiąc, twórcy są odpowiedzialni za zapełnienie biblioteki cyfrowej obiektami cyfrowymi.
  • Użytkownicy - nazywani również czytelnikami, właściwie nie mają obowiązków związanych z biblioteką cyfrową. Korzystają oni z materiałów dostępnych w bibliotece, a aby do nich dotrzeć, korzystają również z różnych funkcji, w tym z wyszukiwania i przeglądania. Zwykle korzystają oni z biblioteki cyfrowej w sposób bierny, ale od niedawna pojawia się nowe podejście do roli użytkownika, umożliwiające im aktywny udział w tworzeniu biblioteki, np. przez dodawanie tagów lub przesyłanie własnych obiektów cyfrowych.

Przykłady popularnych bibliotek cyfrowych

Na całym świecie istnieje ogromna ilość bibliotek cyfrowych, kilka zasługuje na szczególną uwagę ze względu na ich rolę historyczną, zasięg geograficzny czy autorytet instytucji zarządzającej. Poniżej przedstawiamy w skrócie niektóre z interesujących inicjatyw związanych z tworzeniem bibliotek cyfrowych.

Projekt Gutenberg (http://www.gutenberg.org/)

Powszechnie uznaje się, że była to pierwsza biblioteka cyfrowa na świecie. Projekt Gutenberg został zapoczątkowany przez Michaela Harta w 1971 r. cyfryzacją Deklaracji Niepodległości Stanów Zjednoczonych. W deklaracji celów autorstwa Michaela Harta znalazło się stwierdzenie, że celem portalu jest zachęcenie do tworzenia i rozpowszechniania książek elektronicznych (ang. eBooks). Portal jest tworzony wyłącznie przez wolontariuszy, którzy mają szeroki zakres swobody. Ogólnie rzecz biorąc, każdy kto chce współpracować przy projekcie jest mile widziany. Obecnie Projekt Gutenberg umożliwia dostęp do ponad 53000 darmowych e-książek. 5c

Ilustracja 5. Strona główna portalu Projekt Gutenberg (zrzut ekranu strony głównej portalu Projekt Gutenberg).

 

World Digital Library (Światowa Biblioteka Cyfrowa) (http://www.wdl.org/)

Światowa Biblioteka Cyfrowa (ang. World Digital Library, WDL) będąca inicjatywą UNESCO i Biblioteki Kongresu, została uruchomiona w kwietniu 2009 r. Zgodnie z deklaracją celów "Światowa Biblioteka Cyfrowa udostępnia w Internecie bezpłatnie wielojęzyczne materiały pochodzące z państw i kultur całego świata". Celem WDL jest promocja zasobów cyfrowych, zwiększenie ich różnorodności w Internecie, dostarczenie badaczom, dydaktykom oraz innym zainteresowanym osobom różnorodnych zasobów cyfrowych oraz wymiana wiedzy pomiędzy współpracującymi instytucjami. Ilość dostępnych zasobów cyfrowych pod koniec marca 2011 r. to prawie 1700 pozycji, wśród których znajdują się najważniejsze książki i inne dokumenty z całego świata. WDL posiada bardzo interesujący system przeglądania zasobów. Na stronie głównej biblioteki znajduje się mapa świata umożliwiająca natychmiastowe przeszukiwanie zasobów pochodzących z poszczególnych części świata. 7c Ilustracja 6. Stara mapa Europy znaleziona na stronie Światowej Biblioteki Cyfrowej (zrzut ekranu strony internetowej Światowej Biblioteki Cyfrowej [źródło]).
Ilustracja 6. przedstawia szczegółowe informacje dotyczące mapy Europy pochodzącej z początku XX wieku. Klikając w miniaturowy obrazek mapy w górnym lewym rogu strony otrzymamy mapę w pełnym rozmiarze.

Europeana (http://www.europeana.eu/)

Powstanie Europeany było możliwe dzięki wsparciu Komisji Europejskiej, która nadal wspiera tą największą europejską bibliotekę cyfrową w różnych obszarach działalności. Europeana stanowi sieć tematyczną założoną przez Komisję Europejską w ramach programu eContentplus, będącego częścią inicjatywy UE - i2010. Europeana umożliwia dostęp do europejskiego dziedzictwa kulturowego, w tym tekstów, obrazów oraz nagrań filmowych i dźwiękowych. Ogromna liczba zasobów cyfrowych dostępnych za pośrednictwem Europeany ciągle wzrasta. Pod koniec 2010 r. osiągnęła liczbę 15 milionów pozycji. Oprócz zasobów cyfrowych, na stronie internetowej Europeany można znaleźć liczne interaktywne i innowacyjne funkcje, takie jak Moja Europeana czy ThoughtLab [źródło]. 9c

Ilustracja 7. Materiał filmowy przedstawiający fragment wiadomości dotyczący TGV we Francji z 1981 r., dostępny na stronie Europeany (zrzut ekranu strony internetowej Europeana [źródło]).

Internet Archive (Archiwum Internetu) (http://www.archive.org/)

Archiwum Internetu (ang. Internet Archive) powstało z inicjatywy Brewstera Kahle w 1996 r. i zostało opisane na oficjalnej stronie internetowej następująco: "Internet Archive jest organizacją non-profit założoną w celu stworzenia biblioteki internetowej. Jej celem jest przede wszystkim zapewnienie badaczom, historykom, studentom, osobom niepełnosprawnym i ogółowi społeczeństwa, stałego dostępu do historycznych kolekcji istniejących w formacie cyfrowym". Interesującym elementem tej biblioteki cyfrowej jest tzw. Maszyna czasu (ang. WayBack machine) będąca biblioteką cyfrową stron internetowych, umożliwiającą użytkownikom obejrzenie archiwalnych wersji dowolnej strony z dowolnego okresu czasu, na przykład sprzed 10 lat. Obecnie Archiwum Internetu zawiera ponad 510 miliardów stron internetowych i około 3 miliony innych zasobów [źródło]. 7c Ilustracja 8. Maszyna czasu dostępna w Archiwum Internetu - rezultat dla strony internetowej: http://www.cern.ch (zrzut ekranu strony internetowej Internet Archive). Ilustracja 8 prezentuje rezultaty wyszukiwarki Maszyny czasu dla strony internetowej - http://www.cern.ch. Maszyna czasu jest w stanie przedstawić strony internetowe w kolejności w jakiej udostępniane były w przeszłości. Ilustracja przedstawia rezultaty wyszukiwania dla strony http://www.cern.ch w ciągu kilku ostatnich lat - użytkownik może otworzyć poszczególne linki i zobaczyć jak strona wyglądała wcześniej np. w 1996 r. CERN (Europejska Organizacja Badań Jądrowych), której strona internetowa jest prezentowana, jest miejscem stworzenia idei stron WWW (ang. the World Wide Web).

Książki Google (http://books.google.com/)

Książki Google (ang. Google Books) są usługą udostępnianą przez firmę Google, umożliwiającą wyszukiwanie pełnych tekstów książek, wcześniej zeskanowanych, przetworzonych i zindeksowanych przez Google. Książki Google zapewniają darmowy dostęp do wszystkich zasobów znajdujących się w domenie publicznej oraz umożliwiają lokalizację i zakup tych książek, które chronione są prawami autorskimi. W 2015 r. Książki Google oferują dostęp do ponad 25 milionów pozycji.  Księgarnia Google Play Books uzupełnia wyszukiwarkę Książek Google, dając użytkownikom możliwość dostępu on-line do wszystkich ebooków znajdujących się "półkach" Google. Użytkownik będzie mógł zakupić książkę, po czym uzyska do niej dostęp on-line i będzie mógł z niej skorzystać kiedy tylko będzie chciał, zgodnie ze sloganem reklamowym księgarni Google Play Books - "kup gdziekolwiek, czytaj gdziekolwiek" [źródło].
10c Ilustracja 9. Wyniki wyszukiwania dla słowa "Europa" w serwisie Książek Google (zrzut ekranu wyników wyszukiwania Książek Google).

Podstawowe funkcje biblioteki cyfrowej

Istnieje kilka podstawowych funkcji biblioteki cyfrowej, które są rzeczywiście niezbędne z punktu widzenia użytkowników. Funkcje te są głównie związane z dodawaniem i wyszukiwaniem obiektów cyfrowych, zostały one przedstawione poniżej.

Dodawanie obiektów cyfrowych

Aby możliwe było wyszukiwanie czy przeglądanie jakikolwiek obiektów w bibliotece cyfrowej, trzeba je najpierw stworzyć i przesłać na serwer biblioteki. Przesyłanie obiektu cyfrowego jest procesem polegającym na dodawaniu obiektów cyfrowych do biblioteki cyfrowej. Istnieje wiele możliwości dokonania tego procesu m.in. za pośrednictwem formularza dostępnego na stronie internetowej, czy dedykowanych aplikacji itp.

Wyszukiwanie w bibliotece cyfrowej

Kluczową funkcję w każdej bibliotece cyfrowej pełni wyszukiwarka. Umożliwia ona czytelnikom wyszukiwanie obiektów cyfrowych za pomocą pojedynczych słów czy fraz. Na przykład, gdy czytelnik chce wyszukać książki napisane przez Adama Mickiewicza, musi w oknie wyszukiwarki wpisać wyrażenie "Adam Mickiewicz" i wcisnąć Enter na klawiaturze komputera. Reszta pracy spoczywa na mechanizmie wyszukiwania biblioteki cyfrowej. Przeszukuje on po kolei wszystkie dokumenty zgromadzone w zasobach biblioteki i wybiera te, które najbardziej pasują do wyrażenia "Adam Mickiewicz". Wyniki są następnie prezentowane na stronie internetowej.
11c
Ilustracja 10. Wyniki wyszukiwania na stronie Europeany hasła "Adam Mickiewicz" (zrzut ekranu wyników wyszukiwania na stronie internetowej Europeana).

Przeglądanie biblioteki cyfrowej

Poza mechanizmem wyszukiwania, niezwykle ważną funkcją jest przeglądanie zasobów. Przeglądanie umożliwia czytelnikom sprawdzenie listy obiektów cyfrowych, dostępnych w bibliotece cyfrowej. Lista może zawierać wszystkie obiekty cyfrowe albo część z nich, dotyczącą określonego tematu lub kolekcji obiektów cyfrowych. Istnieją różne metody przeglądania zasobów, które przedstawione są na poniższych ilustracjach.
12c
Ilustracja 11. Przeglądanie listy autorów portalu Projekt Gutenberg (zrzut ekranu strony internetowej portalu Project Gutenberg). Projekt Gutenberg oparty jest na mechanizmie prostego przeglądania tekstowego według autora albo tytułu pozycji. W przypadku przeglądania listy autorów, po wybraniu określonej litery, na stronie ukazuje się lista autorów, których nazwisko rozpoczyna się od wybranej litery. Podobnie działa to w przypadku przeglądania tytułów.
13c
Ilustracja 12. Przeglądanie wg miejsca na stronie Światowej Biblioteki Cyfrowej (zrzut ekranu strony internetowej World Digital Library) Światowa Biblioteka Cyfrowa (ang. World Digital Library) umożliwia przeglądanie zgromadzonych obiektów cyfrowych na kilka różnych sposobów. Jednym z nich jest przeglądanie zasobów wg miejsca, przedstawione na ilustracji 12. Jest to bardzo atrakcyjny graficznie interfejs, pozwalający czytelnikom wybrać i obejrzeć obiekty cyfrowe według ich miejsca pochodzenia.

Infrastruktura bibliotek cyfrowych w Polsce

Wstęp

W poprzedniej części przedstawiono czym jest biblioteka cyfrowa, jakie są powody i sposoby jej funkcjonowania oraz jakie korzyści wynikają z jej użytkowania. Omówiono przykłady najbardziej znanych światowych bibliotek cyfrowych takich jak Projekt Gutenberg czy Europeana. Coraz więcej instytucji decyduje się na digitalizację zbiorów przechowywanych do tej pory w magazynach oraz udostępnienie ich nie tylko w czytelni, ale również internautom odwiedzającym strony biblioteki. Na przykładzie wybranych bibliotek, przedstawione zostaną historia, typy, infrastruktura i charakterystyka wybranych polskich bibliotek cyfrowych. Zostaną omówione również niektóre mechanizmy będące podstawą działania Portalu Federacji Bibliotek Cyfrowych, zbierającego informacje o obiektach udostępnianych w polskich bibliotekach cyfrowych.

Biblioteki Cyfrowe w Polsce

Historia, charakterystyka, infrastruktura.

Pierwszą biblioteką cyfrową udostępnioną w Polsce była Wielkopolska Biblioteka Cyfrowa (http://www.wbc.poznan.pl). Powstała w 2002 r. w oparciu o oprogramowanie dLibra, które było rezultatem współpracy pomiędzy Poznańskim Centrum Superkomputerowo-Sieciowym i Poznańską Fundacją Bibliotek Naukowych. WBC jest obecnie największą polską biblioteką cyfrową jej zbiory to ponad 40% zasobów Federacji Bibliotek Cyfrowych, od 2004 r. odwiedziło ją ponad 17 mln użytkowników (dane z sierpnia 2011 r.) Następną biblioteką cyfrową była nieistniejąca już Polska Biblioteka Internetowa. Wstępne założenia projektu tej biblioteki opisano w Programie Powszechnej Informatyzacji „Nowoczesna Polska”, który zakładał wprowadzenie do wszystkich obszarów oświaty i nauki w Polsce edukacji informatycznej. Biblioteka została oficjalnie udostępniona 1 września 2003 roku. Zasadniczym celem jej powołania było wyrównanie szans dostępu do różnorodnych publikacji wydanych dotychczas w języku polskim osobom pochodzącym z małych miast, wsi czy innych regionów oddalonych od ośrodków akademickich i kulturalnych. Niestety sposób realizacji i dalszy rozwój PBI nie przyniósł oczekiwanych efektów. Została podjęta odgórna decyzja o zaprzestaniu dofinansowania i dalszego rozwoju biblioteki. Prace badawczo-rozwojowe w zakresie bibliotek cyfrowych prowadzono w PCSS już od 1996 roku. Zintensyfikowano je w roku 1999 wraz z rozpoczęciem projektu dLibra (http://dlibra.psnc.pl). Celem projektu było umożliwienie tworzenia bibliotek cyfrowych przez różnego rodzaju instytucje zarówno naukowe jak i kulturalne. Uruchomienie WBC zakończyło pierwszą fazę rozwoju tego systemu, który stał się później podstawą dla budowy ogólnopolskiej infrastruktury bibliotek cyfrowych. W 2004 r. PCSS zdecydowało się zorganizować pierwszą edycję warsztatów poświęconych tworzeniu bibliotek cyfrowych z wykorzystaniem oprogramowania dLibra. Możliwość wymiany pomysłów i doświadczeń pomogła kształtującej się wówczas społeczności polskich bibliotekarzy cyfrowych. W listopadzie 2004 roku ruszyła kolejna – Biblioteka Cyfrowa Politechniki Wrocławskiej, która rok później stała się drugą polską regionalną książnicą cyfrową – Dolnośląską Biblioteką Cyfrową (http://www.dbc.wroc.pl/). We wrześniu 2005 roku, na Uniwersytecie Mikołaja Kopernika w Toruniu uruchomiona została Kujawsko-Pomorska Biblioteka Cyfrowa (http://kpbc.umk.pl/), pierwsza w Polsce biblioteka cyfrowa sfinansowana częściowo z funduszy Unii Europejskiej. Ważnym elementem w rozwoju polskiego bibliotekarstwa cyfrowego było z pewnością utworzenie w początkach 2007 forum Biblioteka 2.0 (http://forum.biblioteka20.pl). Forum to także dziś pełni rolę ważnego narzędzia konsolidującego społeczność zainteresowaną tematyką digitalizacji i bibliotek cyfrowych.
W rezultacie tych działań liczba cyfrowych bibliotek w Polsce zaczęła rosnąć. Do 2007 r. powstało ich 20, natomiast w 2011 r. było już 84 bibliotek cyfrowych (co roku przybywa kilka lub kilkanaście nowych bibliotek). Tak szybki wzrost związany był także z większą dostępnością w ostatnich latach funduszy na projekty digitalizacji, zarówno z krajowych, jak i europejskich środków. Aktualnie, w roku 2016, w zasobach polskich bibliotek cyfrowych znajdują się prawie 4 miliony obiektów cyfrowych z kilkuset instytucji. Informacja o zbiorach przez nie oferowanych jest zbierana przez FBC o czym opowiemy w dalszej części kompendium.

Przykłady polskich bibliotek cyfrowych

W kolejnej części zaprezentowane zostaną przykłady polskich bibliotek cyfrowych, które tworzone są zarówno przez małe, lokalne instytucje jak i przez duże biblioteki akademickie. W ich tworzenie zaangażowane są jednak nie tylko biblioteki – przykłady bibliotek regionalnych czy projektów takich jak „Cyfrowe Archiwum Agnieszki Osieckiej” świadczą o tym, że również instytucje prywatne, muzea i archiwa umieszczają w sieci duże ilości materiałów cyfrowych. Celem tego przeglądu jest właśnie zaprezentowanie tej różnorodności. 14c Ilustracja 13. Przykładowy filmu pochodzący z zasobów Jeleniogórskiej Biblioteki Cyfrowej [źródło]  

Publiczne Cyfrowe Archiwum Agnieszki Osieckiej

http://archiwumagnieszkiosieckiej.pl/ W 2007 narodził się pomysł stworzenia cyfrowego archiwum Agnieszki Osieckiej. Był to czas, w którym rodzina pisarki musiała zdecydować czy złożony w 1997 roku depozyt w Muzeum Literatury zostawić już na zawsze w tej instytucji, czy też podjąć się przygotowania serii wydawniczej z oficyną „Prószyński i S-ka” i opracowania spuścizny Poetki. Utworzone przez Fundację Okularnicy im. Agnieszki Osieckiej archiwum cyfrowe działa od kwietnia 2009 r. W kolekcji znajduje się ponad 886 publikacji. 15c Ilustracja 14. Strona główna Archiwum Agnieszki Osieckiej. Inwentaryzacja Archiwum liczy kilkadziesiąt stron formatu A4. Zbiory składające się z ok. 1000 teczek A4 i ok. 10 000 fotografii (odbitek i negatywów) można podzielić na dwie podstawowe części: osobiste materiały poetki oraz jej spuściznę literacką, którą tworzą np.: programy teatralne, plakaty teatralne, recenzje itd. Wśród publikacji najczęściej odwiedzanych w archiwum znajdują się m.in.: Rękopis – pierwszy pamiętnik Agnieszki Osieckiej (wtedy 9-letniej) napisany w okresie od 27. XII 1945 do 2. I 1946. 16c Ilustracja 15. Znajdujący się w Archiwum rękopis 9-letniej Agnieszki Osieckiej.

Wielkopolska Biblioteka Cyfrowa

http://www.wbc.poznan.pl WBC jest wspólną inicjatywą poznańskiego środowiska akademickiego – uczestnikami projektu są instytucje związane z Poznaniem i Wielkopolską. Inicjatorami projektu są: Poznańska Fundacja Bibliotek naukowych (http://www.pfsl.poznan.pl/) oraz Poznańskie Centrum Superkomputerowo – Sieciowe (pełna lista osób i instytucji, których zbiory obecnie są udostępniane w WBC http://www.wbc.poznan.pl/dlibra/pubstats?statType=495). Jest to pierwsza polska regionalna biblioteka cyfrowa (tzn. gromadzi zbiory różnych instytucji pochodzących i dotyczących danego regionu), powstała w październiku 2002 roku, przy użyciu oprogramowania dLibra. W 2016 r. jest ona jednym z trzech największych dostawców treści w FBC (obok Cyfrowej Biblioteki Narodowej POLONA i Jagiellońskiej Biblioteki Cyfrowej). 17c Ilustracja 16. Wielkopolska Biblioteka Cyfrowa - strona główna Podstawowym założeniem WBC jest umożliwienie internetowego dostępu do czterech typów zasobów: zasoby edukacyjne (skrypty, podręczniki i monografie naukowe); zasoby dziedzictwa kulturowego (wybrane zabytki piśmiennictwa znajdujące się w bibliotekach poznańskich); regionalia (piśmiennictwo dotyczące Poznania i Wielkopolski); muzykalia (nuty i piśmiennictwo związane z muzyką). W zasobach WBC znajdują się głównie gazety (39%) oraz czasopisma (35%). Oprócz tego inne publikacje (25%) to np. akta, starodruki, rękopisy, wspomnienia lub monografie. Wśród publikacji dostępnych w WBC można znaleźć między innymi cyfrową wersję Biblii brzeskiej oraz „Statut – prawa książąt mazowieckich”. Biblia brzeska to polski przekład biblii pochodzący z XVI wieku. Oryginalna księga, ze względów bezpieczeństwa, nie jest udostępniana szerokiej widowni. Dzięki publikacji w WBC jest ona dostępna dla wszystkich. 18c Ilustracja 17. Biblia brzeska - publikacja WBC „Biblia swięta, tho iest, Księgi Starego y Nowego Zakonu, wlasnie z Zydowskiego, Greckiego, y Łaćińskiego, nowo na Polski ięzyk z pilnośćią y wiernie wylożone [tzw. "Biblia brzeska"] [Stary Testament]” (identyfikator publikacji: oai:www.wbc.poznan.pl:2752)  

Elektroniczna Biblioteka Uniwersytetu Warszawskiego

http://ebuw.uw.edu.pl/dlibra Elektroniczną bibliotekę Uniwersytetu Warszawskiego (w skrócie e-bUW) tworzą biblioteki oraz Archiwum i Muzeum UW. Organizatorem i koordynatorem projektu oraz głównym jego wykonawcą jest Biblioteka Uniwersytecka w Warszawie. 19c Ilustracja 18. Strona główna Elektronicznej Biblioteki Uniwersytetu Warszawskiego Zbiory e-bUW zostały pogrupowane w kolekcjach tematycznych: dziedzictwo kulturowe, e-publikacje, historia UW i BUW, nauka i dydaktyka. Zawarte w nich cyfrowe publikacje reprezentują wszystkie typy dokumentów: książki, czasopisma, rękopisy, inkunabuły, stare druki, dokumenty życia społecznego, grafikę i rysunki, muzykalia, kartografika, a także e-publikacje. Biblioteka jest dostępna publicznie od listopada 2007, w 2016 gromadzi ona ponad 283 000 obiektów. W zasobach e-BUW znajdują się głównie czasopisma (98%) oraz nieliczne (2%) inne rodzaje publikacji np. książki, pocztówki lub papiery wartościowe. Wśród publikacji dostępnych w e-BUW można znaleźć m.in. rysunek gabinetu marmurowego. „Gabinet Marmurowy : wykonany wg projektu Jakuba Fontany z r. 1768, wykończony w r. 1771 : widok ściany północnej z portretem króla pędzla Bacciarellego nad kominkiem; rzuty odrzwi i pilastrów przyściennych / rys. J. Ch. Kamsetzer.” (identyfikator publikacji: oai:ebuw.uw.edu.pl:123) 20c Ilustracja 19. Rysunek przedstawiający gabinet marmurowy, z zasobów e-BUW.  

Cyfrowa Biblioteka Narodowa POLONA

http://www.polona.pl/ “Polona to nowoczesny portal, który udostępnia w sieci zbiory Biblioteki Narodowej. Jest narzędziem pozwalającym na powszechne otwarcie dla czytelników skarbca i magazynów Biblioteki Narodowej. Pozwoli również prezentować zbiory innych instytucji kultury.” [źródło] 21c Ilustracja 20. Strona główna CBN POLONA POLONA wyróżnia się na tle innych polskich bibliotek cyfrowych podejściem do kolekcji cyfrowych. Podążając z duchem czasu, wykorzystuje i inspiruje się najróżniejszymi trendami i zjawiskami obecnymi na m.in. portalach społecznościowych, aby dotrzeć do jak naszerszego grona czytelników (nawet do ludzi potencjalnie niezainteresowanych korzystaniem z bibliotek cyfrowych). Na pierwszej stronie POLONY codziennie pokazywane są najciekawsze obiekty i kolekcje tematyczne. Cały portal został zbudowany jako one-page application, co oznacza, że do działania nie wymaga przeładowania strony. Film 1. Film promujący nową wersję portalu POLONA. Ciekawie rozwiązany został dział “Biblioteka” - widać w nim wszystkie obiekty, jak w popularnych serwisach społecznościowych służących do przeglądania fotografii, działających na zasadzie “tablicy z obrazkami” np. Flickr, Pinterest czy Tumblr. Po prawej stronie tytułu wyświetla się aktualna liczba obiektów dostępnych w portalu - 2016r. było to ok 1 587 726 (jednak część z nich dostępna jest wyłącznie w czytelniach Biblioteki Narodowej). 22c Ilustracja 21. Przykładowy obiekt w portalu POLONA (litografia malowana ręcznie). Oprócz wielu zalet upodobnienia portalu biblioteki cyfrowej do portalu społecznościowego, istnieje też jednak parę minusów takiego rozwiązania. Należy zwrócić uwagę na to, że nie każdy użytkownik nastawiony jest na przeglądanie ciekawostek w celach rozrywkowych czy hobbystycznych. Na obecnym rozwiązaniu na pewno nie skorzystają naukowcy, ponieważ portalowi zabrakło m.in. możliwości sprawnego i intuicyjnego przeglądania kolejnych numerów czasopisma. Nowoczesny layout wprowadzony został kosztem uporządkowanej struktury zawartości biblioteki. Inną wadą aktualnej konstrukcji POLONY na zasadzie one-page application jest jest znacznie słabsza widoczność zbiorów tej biblioteki w wyszukiwarce Google.

Modele bibliotek cyfrowych w Polsce

mapka Ilustracja 22. Mapa rozmieszczenia konsorcjalnych i instytucjonalnych bibliotek cyfrowych w Polsce [źródło]. Polskie biblioteki cyfrowe można podzielić na dwa typy: konsorcjalny i instytucjonalny. Konsorcjalne biblioteki cyfrowe tworzy kilka instytucji, a co najmniej jedna z nich pełni rolę koordynatora. Typ instytucjonalny to repozytoria tworzone przez jedną instytucję. Różnice między tymi modelami widoczne są w zasobach gromadzonych i udostępnianych przez daną bibliotekę cyfrową. W bibliotekach konsorcjalnych typ udostępnianych zasobów zależy od motywów poszczególnych współtworzących instytucji. Konsorcjum (czy też instytucja wiodąca) może określać pewne ramy tematyczne, proceduralne i jakościowe na które muszą się zgodzić wszystkie instytucje przystępujące do tworzenia danej biblioteki.
Przykładami bibliotek konsorcjalnych są:
Biblioteki instytucjonalne udostępniają zasoby związane z działalnością lub zbiorami znajdującymi się w posiadaniu instytucji tworzącej daną bibliotekę. Charakter tych zasobów zależy więc od profilu danej instytucji, przykłady tego typu bibliotek to:
Należy również wspomnieć o rozróżnieniu modeli bibliotek według zaplecza sprzętowego. W bibliotekach instytucjonalnych odpowiedzialność za to zaplecze sprzętowe spada na jedną instytucję co determinuje fakt, iż model instytucjonalny tworzą zazwyczaj duże jednostki, które mają środki i możliwość zapewnienia tych niezbędnych czynników. W bibliotekach konsorcjalnych sprawa wygląda inaczej, koszty mogą zostać podzielone między partnerów współtworzących bibliotekę, a instytucja wiodąca jest koordynatorem odpowiadającym za rozwój i utrzymanie tej infrastruktury.

Czym jest Federacja Bibliotek Cyfrowych?

Informacje ogólne

Ważny etap budowy sieci rozproszonych bibliotek cyfrowych i repozytoriów w Polsce wiąże się z powstaniem w czerwcu 2007 r. Federacji Bibliotek Cyfrowych (FBC). Podstawą współfunkcjonowania bibliotek cyfrowych w skali kraju, jest ich organizacja w oparciu o zastosowanie otwartych protokołów, dających technicznie możliwość wymiany danych pomiędzy bibliotekami cyfrowymi niezależnie od używanego przez nie oprogramowania.

Historia i charakterystyka

Rezultaty pierwszego etapu rozwoju serwisu sieciowego "Federacja bibliotek cyfrowych PIONIER" po raz pierwszy zostały zaprezentowane 22 czerwca 2007 r. podczas spotkania konsorcjum PIONIER oraz w Internecie na stronie http://fbc.pionier.net.pl/. Główną funkcjonalnością Federacji była możliwość przeszukiwania metadanych w formacie Dublin Core, zebranych z polskich bibliotek cyfrowych. W następnych etapach rozwoju została uruchomiona druga część serwisu. Została ona zaprojektowana do zbierania metadanych, określających obiekty zaplanowane do digitalizacji i publikacji on-line. Informacje tego typu są automatycznie publikowane w bibliotekach cyfrowych opartych na systemie dLibra. Twórcy bibliotek cyfrowych, które nie korzystają z dLibry, zgodzili się zaimplementować ten mechanizm samodzielnie, uznając jego duże znaczenie dla użytkowników bibliotek cyfrowych. Opcja wyszukiwania dała użytkownikom serwisu możliwość odnalezienia zarówno już zdigitalizowanych obiektów, jak też obiektów, których digitalizacja jest dopiero planowana. Oczywiście dostępne są także zaawansowane możliwości wyszukiwania, pozwalające łączyć różne kryteria wyszukiwawcze, wybierać biblioteki oraz pożądane typy obiektów.
23c
Ilustracja 23. Stara wersja portalu FBC.
Od 2015 r. oficjalnie działa nowsza wersja portalu Federacji. Oferuje ona wygodniejsze narzędzia wyszukiwania, bardziej atrakcyjny interfejs użytkownika, a także sekcję Rekomendowane, w której można znaleźć kompilacje tematyczne różnych interesujących obiektów znajdujących się w bibliotekach należących do FBC.
24c
Ilustracja 24. Strona główna portalu FBC w 2016 r.
Podstawą dla działania funkcji oferowanych przez FBC jest protokół OAI-PMH. Jest to techniczna specyfikacja określająca w jaki sposób dwie niezależne usługi mogą wymieniać się informacjami o posiadanych obiektach. OAI-PMH to uznany na całym świecie standard w tej dziedzinie i jest wykorzystywany również przez serwisy takie jak Europeana (http://europeana.eu). Wykorzystanie tego protokołu pozwoliło również wdrożyć system unikalnych identyfikatorów dla obiektów składowanych w polskich bibliotekach cyfrowych. Są to tzw. identyfikatory OAI i dzięki ich wykorzystaniu użytkownicy zawsze odnajdą poszukiwany obiekt, niezależnie od zmian jakie mogą nastąpić w strukturze danej biblioteki cyfrowej. Identyfikator OAI pozwala skonstruować odnośnik, który zawsze będzie aktualny, tym samym idealnie nadaje się do stosowania we wszelkiego rodzaju odwołaniach bibliograficznych. Przystąpienie do FBC jest bezpłatne, nie wymaga przekazywania publikacji cyfrowych na rzecz FBC, ani podpisywania umów pomiędzy instytucją tworzącą bibliotekę, a IChB PAN PCSS. Szczegółowe informacje na temat współpracy znajdują się na stronie FBC "Dla dostawców danych".
Obok unikalnych identyfikatorów i wyszukiwania w planach digitalizacji FBC oferuje również inne funkcje. Jedną z nich jest zapobieganie powstawania duplikatów już na etapie planowania digitalizacji:
  1. Redaktor biblioteki cyfrowej przygotowuje opis publikacji przeznaczonej do digitalizacji,
  2. System biblioteki cyfrowej sprawdza ten opis w FBC – określa w ten sposób, czy planowana publikacja została już udostępniona w FBC,
  3. Redaktor dostaje informację zwrotną i na tej podstawie zatwierdza publikację jako planowaną, bądź też usuwa ją z planów digitalizacji
Wciąż wymagany jest zatem ludzki wkład, ale podstawowe działania, takie jak wyszukiwanie podobnych obiektów w innych bibliotekach cyfrowych są w pełni zautomatyzowane i zintegrowane z działaniem całego serwisu. Obecnie mechanizm ten dostępny jest w systemie dLibra 4.0 i nowszych.

Portal FBC

25c Ilustracja 25. Schemat funkcjonowania portalu FBC Portal FBC utrzymuje bazę danych polskich bibliotek cyfrowych (patrz http://fbc.pionier.net.pl/pro/zrodla/), która jest (i powinna być) aktualizowana we własnym zakresie przez poszczególne biblioteki cyfrowe - każda uczestnicząca biblioteka aktualizuje swoje dane — jest to jedna z podstaw płynnego funkcjonowania FBC. W wykazie bibliotek cyfrowych podane są informacje ogólne takie, jak nazwa, URL, podstawowe dane kontaktowe i opis danej biblioteki, ale również szczegółowa lista instytucji wprowadzających materiały do danej biblioteki cyfrowej, lista rekomendowanych obiektów i informacji technicznych na temat interfejsu OAI-PMH i stosowanego oprogramowania.  Informacja na temat każdej biblioteki cyfrowej i każdej instytucji może być również wzbogacona danymi dotyczącymi lokalizacji geograficznej. Dane te używane są do przedstawienia bibliotek i instytucji na mapie Polski.

Czym jest protokół OAI-PMH?

Protokół OAI-PMH jest w pierwszej kolejności wykorzystywany do automatyzacji wymiany metadanych. Zgodnie z definicjami zapisanymi w protokole, do wymiany metadanych dochodzi między dwiema głównymi stronami: dostawcami usług (tzw. harwesterami) i dostawcami danych (repozytoriami). Dostawcy usług używają protokołu OAI, aby odczytać dane udostępnione przez dostawców danych przez interfejs OAI.
Przykładem dostawcy danych może być biblioteka cyfrowa, która eksponuje metadane udostępnianych przez siebie obiektów cyfrowych (jest to funkcja standardowo oferowana przez biblioteki stworzone w oparciu o dLibrę). Informacje te nastepnie zbiera harwester Federacji Bibliotek Cyfrowych (FBC). Dzieki temu, że specyfikacja protokołu OAI-PMH jest ogólnie znana nie ma znaczenia jakiego dokładnie oprogramowania używa biblioteka cyfrowa. Jeżeli oprogramowanie jest zgodne z protokołem, dane pochodzące z danej biblioteki mogą być pobierane przez FBC (czy też harwestery innych portali tego typu).
Aktualna wersja protokołu OAI-PMH (2.0) została opublikowana 14 czerwca 2002 r. Obecnie oficjalna lista OAI zarejestrowanych dostawców danych składa się z ponad 3200 repozytoriów. Rejestr dostawców danych OAI-PMH Uniwersytetu w Illinois wymienia ponad 2400 aktywnych repozytoriów. Istnieje również wiele serwisów sieciowych opartych na danych pozyskanych za pomocą protokołu OAI-PMH (przykłady można znaleźć pod adresem http://www.openarchives.org/service/listproviders.html). Jednym z najbardziej popularnych serwisów opartych na OAI jest OAIster, “katalog rozproszony zasobów cyfrowych”. Obecnie (w 2016 r.) znajduje się w nim prawie 30 milionów rekordów pozyskanych z ponad 1500 repozytoriów.
Źródło definicji i objaśnień w języku angielskim: http://www.openarchives.org/OAI/openarchivesprotocol.html

FBC a Europeana

26c Ilustracja 26. Zasoby lokalne i regionalne w Europeanie. Od 11 grudnia 2009 roku w ramach Europejskiej Biblioteki Cyfrowej Europeana (http://europeana.eu/) dostępne są zasoby kilkudziesięciu polskich bibliotek cyfrowych, skupionych wokół Federacji Bibliotek Cyfrowych (http://fbc.pionier.net.pl/, FBC) sieci PIONIER (http://www.pionier.net.pl/). Zasoby te obejmują w tej chwili (2016 r.) ponad 1 501 000 obiektów cyfrowych udostępnionych przez kilkaset instytucji kultury i nauki z całej Polski.
Oprócz zbiorów Federacji Bibliotek Cyfrowych, bezpośrednio do Europeany swoje zasoby przekazują jeszcze polscy partnerzy projektów Athena (Międzynarodowe Centrum Zarządzania Informacją) i European Film Gateway (Filmoteka Narodowa).
Europeana to jedna z flagowych inicjatyw Komisji Europejskiej, której celem jest stworzenie portalu internetowego stanowiącego punkt dostępu do kulturowego i naukowego dziedzictwa Europy w postaci cyfrowej. Portal ten funkcjonuje w Internecie od listopada 2008 roku. Z chwilą oficjalnego uruchomienia pozwalał on na dotarcie do około 2 milionów obiektów cyfrowych rozproszonych po całej Europie (w chwili obecnej są to 53 miliony).

Kiedy i jak stworzyć własną bibliotekę cyfrową?

Wstęp

Coraz więcej instytucji kultury, takich jak biblioteki, muzea lub archiwa, digitalizuje swoje zbiory. Pojawia się w związku z tym pytanie: w jaki sposób udostępnić powstałe w wyniku digitalizacji obiekty cyfrowe użytkownikom? Czy potrzebna jest własna biblioteka cyfrowa? Czy może lepszym pomysłem byłoby przechowywanie obiektów cyfrowych w już istniejącej cyfrowej książnicy? W jaki sposób można przyłączyć się do istniejącej biblioteki cyfrowej? Czytelnik znajdzie tutaj informacje o podstawowych czynnikach, które należy wziąć pod uwagę przy planowaniu takiego przedsięwzięcia. Przedstawione zostaną również możliwości i wymagania techniczne oprogramowania do budowy bibliotek cyfrowych. Na przykładzie kilku istniejących bibliotek cyfrowych, pokazany zostanie również sprzęt komputerowy wymagany do stworzenia i utrzymania cyfrowej książnicy. Nie da się ukryć, że uruchomienie własnej biblioteki cyfrowej może wymagać sporych nakładów finansowych. Jeżeli dana instytucja nie dysponuje odpowiednimi środkami, należy rozważyć przyłączenie się do istniejącej biblioteki cyfrowej. W ostatniej części przedstawiono kilka uwag, które mogą się okazać pomocne.

Tworzenie własnej biblioteki cyfrowej

Główne zagadnienia, które trzeba przemyśleć to:
  • Jakie wymagania ma oprogramowanie do budowy bibliotek cyfrowych? Czy instytucję stać na utrzymanie serwerów spełniających te wymagania i odpowiedniego łącza sieciowego?
  • Jaka jest ilość materiałów, które instytucja planuje udostępnić w bibliotece cyfrowej?
  • Ilu użytkowników będzie potencjalnie korzystać z biblioteki?
  • Czy instytucja posiada zatrudnia (lub posiada zasoby finansowe aby zatrudnić) wykwalifikowany personel IT?
Odpowiedź na część z tych pytań jest trudna, zwłaszcza w sytuacji, gdy nie posiadamy odpowiedniego doświadczenia i wiedzy w zakresie oprogramowania do budowy bibliotek cyfrowych. Warto w takiej sytuacji poradzić się innych instytucji, które zdecydowały się na stworzenie własnej biblioteki cyfrowej. Oczywiście najlepiej zwrócić się do instytucji o podobnym profilu działalności.

Wymagania oprogramowania do budowy bibliotek cyfrowych

Określenie konfiguracji sprzętowej dla serwerów biblioteki cyfrowej to trudne zadanie. Taka konfiguracja zależy m.in. od:
  • Liczby równocześnie korzystających z systemu użytkowników
  • Liczby publikacji w bibliotece cyfrowej
  • Tempa wprowadzania nowych publikacji
  • Rozmiaru plików publikacji i liczby tych plików
  • Tego, czy publikacje posiadają informacje tekstowe, które będą indeksowane (np. OCR)
  • Złożoności tematu opisu publikacji i stopnia szczegółowości tego opisu.
Przygotowanie prostej formuły pozwalającej na określenie optymalnych parametrów sprzętowych serwerów biblioteki cyfrowej jest praktycznie niemożliwe. 27c
Ilustracja 27. Do uruchomienia biblioteki cyfrowej nie są potrzebne profesjonalne serwery - wystarczy zwykły komputer PC. Wraz z wzrostem liczby użytkowników i udostępnianych zasobów może okazać się konieczne przeniesienie biblioteki cyfrowej na profesjonalne serwery. Zdjęcie autorstwa Jesse Wagstaff [źródło].
Jeżeli instytucja posiada już stronę internetową, początkowe oszacowania mogą bazować na dotychczasowej liczbie odwiedzających ją użytkowników. Należy jednak pamiętać, ze treści udostępniane w bibliotece cyfrowej mogą przyciągnąć zupełnie nowych użytkowników. Inne systemy do budowy bibliotek cyfrowych mogą mieć inne wymagania sprzętowe, dokładniejszych informacji należy szukać na stronach producentów. Na początku wystarczy zwykły komputer klasy PC – można rozważyć wykorzystanie sprzętu używanego, co pozwoli znacznie obniżyć cenę, a na początek wystarczy. Zamiast samodzielnie kupować serwer, można również go wynająć. Rozwiązanie takie, jak to ma często miejsce w przypadku outsourcingu, ma wiele zalet, ale może się okazać, że ostateczny koszt będzie znacznie wyższy od kosztu samodzielnego utrzymania niezbędnej infrastruktury.

Utrzymanie serwerów biblioteki cyfrowej

Od liczby obiektów (oraz zajmowanej przez nie przestrzenie dyskowej) i liczby odwiedzających, zależy to, jak szybkie i pojemne łącze internetowe będzie potrzebne, aby zapewnić użytkownikom komfortowe przeglądanie zasobów biblioteki cyfrowej. Należy zauważyć, że zwykłe łącze internetowe, oferowane do użytku domowego, może być za słabe. Poza gwarancjami odnośnie szybkości i wielkości transferu, konieczny jest również stały adres IP, co z reguły wiąże się z dodatkową opłatą. Warto mieć również świadomość, że prędkość łącza może być inna w przypadku wysyłania i pobierania danych. Przy dobieraniu łącza na potrzeby korzystania z Internetu liczy się przede wszystkim prędkość pobierania danych. Gdy planujemy udostępniać dane w Internecie w postaci biblioteki cyfrowej, powinniśmy jednak zadbać o odpowiednio szybkie łącze do wysyłania danych (tzw. łącze wychodzące). Utrzymanie serwera wiąże się również z kosztami energii elektrycznej, zabezpieczeniem na wypadek zaniku zasilania czy pożaru oraz przygotowaniem odpowiednich mechanizmów dla tworzenia kopii zapasowych. W sytuacji, gdy zdecydujemy się wynająć serwer do obsługi biblioteki cyfrowej u zewnętrznego dostawcy, zarówno parametry łącza, adres IP, jak i koszt energii elektrycznej są wliczone w cenę usługi. Taka konsolidacja powinna znacznie ułatwić zarządzanie i planowanie rozwoju biblioteki cyfrowej. Ewentualne dodatkowe koszty mogą być związane z ilością przesyłanych do/z biblioteki cyfrowej danych. W ramach planowania samego procesu digitalizacji, należy określić co i w jakiej ilości będzie skanowane. Na tej podstawie można określić jak będą rosły potrzeby sprzętowe naszej biblioteki cyfrowej. Jeżeli okaże się, że potrzebna przestrzeń dyskowa przekracza obecne możliwości, trzeba oczywiście zapewnić możliwość rozbudowy naszego serwera o dodatkowe dyski twarde. W przypadku korzystania z usług firmy hostingowej (firma dostarczająca serwer jako usługę), wiąże się to przeważnie z niewielkim wzrostem miesięcznych kosztów. W przypadku, gdy to instytucja sprawuje opiekę nad komputerem obsługującym bibliotekę cyfrową, należy zakupić dodatkowy dysk, zainstalować i przygotować do użycia. Kolejna część prezentuje krótki przegląd narzędzi najczęściej wykorzystywanych do budowy bibliotek cyfrowych. Każde z nich ma swoje własne wymagania, dla administracji nimi może być potrzebny personel IT o różnych kwalifikacjach. Wszystkie przedstawione systemy pozwalają stworzyć w pełni funkcjonującą bibliotekę cyfrową. Różnią się one głównie wymaganiami jakie stawiają wobec serwera, ceną oraz dostępnością dokumentacji i wsparcia (płatnego bądź opartego na społeczności użytkowników) w języku polskim. W ich opisie zawarto pewne informacje techniczne, które mogą być pomocne w czasie rozmów z specjalistami w zakresie IT.

Oprogramowanie do budowy bibliotek cyfrowych

DSpace (www.dspace.org)

Jest to platforma systemowa, której zadaniem jest przechowywanie materiałów cyfrowych i ich udostępnianie w perspektywie długoterminowej. Platforma indeksuje treści cyfrowe, dlatego może być używana przez użytkowników do wyszukiwania i pobierania określonych materiałów. DSpace może być wykorzystany do przechowywania i udostępniania: skanów (2D i 3D), fotografii, filmów, książek i wielu innych rodzajów treści. DSpace został opracowany wspólnie przez bibliotekę największej uczelni technicznej na świecie Massachusetts Institute of Technology (MIT) i firmę Hewlett-Packard. System jest dostępny za darmo jako oprogramowanie open-source na zasadach określonych w licencji BSD. System można więc bezpłatnie pobierać i używać do budowy własnego repozytorium. DSpace został napisany w języku Java jest to szczególnie istotna informacja w sytuacji gdy wynajmujemy serwer od zewnętrznej firmy. DSpace jest wykorzystywany z powodzeniem w wielu instytucjach naukowych, bibliotekach, muzeach, archiwach, szpitalach, instytucjach rządowych. Polskim przykładem repozytorium stworzonego w oparciu o oprogramowanie DSpace jest repozytorium Uniwersytetu im. Adama Mickiewicza. https://repozytorium.amu.edu.pl/jspui/
28c
Ilustracja 28. Strona główna Repozytorium Uniwersytetu im. Adama Mickiewicza - stworzonego w oprogramowaniu DSpace Przydatne materiały związane z oprogramowaniem DSpace (materiały w języku angielskim): Anglojęzycznym przykładem biblioteki utworzonej w DSpace jest projekt Meduza udostępniający zdigitalizowane zbiory Centralnej Publicznej Biblioteki w Verii (Grecja) - http://medusa.libver.gr/?locale=eng. Na stronie internetowej DSpace znajduje się także lista użytkowników oprogramowania: http://www.dspace.org/whos-using-dspace .

Greenstone (http://greenstone.org/)

Greenstone jest drugim szeroko rozpowszechnionym narzędziem do budowy bibliotek cyfrowych. Oprogramowanie stworzone zostało na Uniwersytecie Waikato w Nowej Zelandii i jest wykorzystywane obecnie do tworzenia bibliotek na całym świecie. Oprogramowanie to jest w tej chwili rozpowszechniane w dwóch wersjach: Greenstone2 (napisany w języku programowania Perl) oraz Greenstone3 (napisany w języku Java). Podobnie jak w przypadku DSpace, kod źródłowy jest również dostępny publicznie na warunkach określonych w licencji GNU General Public License. Przydatne materiały związane z oprogramowaniem Greenstone (materiały w języku angielskim): Przykładem biblioteki stworzonej w oparciu o to oprogramowanie jest serwis Armenian Rare Books, zawierający stare i rzadkie książki ormiańskie podzielone na 2 podkolekcje: książki drukowane dawno temu (ang. Armenian Early Printed Books) i książki rzadkie (ang. Armenian Rare Books).
28c
Ilustracja 29. Strona główna Armenian Rare Books - biblioteki stworzonej w oprogramowaniu Greenstone W Polsce Greenstone został wykorzystany do budowy Bazy Rozpraw Doktorskich Uniwersytetu Przyrodniczo-Humanistycznego w Siedlcach.

dLibra (www.dlibra.psnc.pl)

System dLibra jest najpopularniejszym w Polsce oprogramowaniem do budowy bibliotek cyfrowych. Od 1999 roku tworzony przez PCSS we współpracy z polskim środowiskiem bibliotekarzy cyfrowych. Jest on wykorzystywany przez kilkaset instytucji do budowy regionalnych i instytucjonalnych cyfrowych bibliotek. Biblioteki te tworzą razem polską platformę rozproszonych bibliotek cyfrowych (działających m.in. w oparciu o możliwości oferowane przez sieć PIONIER), dającą w tej chwili dostęp do kilkuset tysięcy obiektów cyfrowych wraz z ich metadanymi oraz do zaawansowanych usług, takich jak wyszukiwanie rozproszone czy identyfikacja potencjalnych duplikatów. dLibra umożliwia tworzenie profesjonalnych repozytoriów dokumentów cyfrowych oraz udostępnianie ich innym osobom i systemom w Internecie. Oparte o dLibrę biblioteki cyfrowe oferują swoim użytkownikom wiele rozbudowanych możliwości, takich jak przeszukiwanie treści zgromadzonych zasobów, przeszukiwanie opisów bibliograficznych z wykorzystaniem słownika synonimów, grupowanie publikacji cyfrowych i nawigację w ich strukturze czy też precyzyjne i rozbudowane możliwości określania zasad dostępu do zasobów (np. dostęp tylko na komputerach w czytelni). 29c
Ilustracja 30. Schemat przedstawiający działanie systemu dLibra dLibra to oprogramowanie o zamkniętym kodzie źródłowym, aby z niego skorzystać konieczne jest wykupienie stosunkowo niedrogiej licencji. Oprogramowanie to zostało napisane w języku Java.
Przydatne materiały związane z oprogramowaniem dLibra:

Uruchomienie i organizacja pracy w bibliotece cyfrowej

Analiza wszystkich przedstawionych dotychczas zagadnień powinna ułatwić podjęcie decyzji czy uruchomienie biblioteki cyfrowej leży w zasięgu możliwości instytucji czy też nie. Jeżeli podjęta zostanie decyzja o budowie własnej książnicy cyfrowej, należy przejść do właściwej fazy planowania tego przedsięwzięcia. Najistotniejsze jest wówczas zidentyfikowanie, zaplanowanie i zorganizowanie wszystkich zadań, które są potrzebne do uruchomienia i utrzymania biblioteki cyfrowej. Główne zagadnienia przy planowaniu i organizacji to (opisane szczegółowo w wymienionych niżej internetowych podręcznikach i artykułach): personel, podział zadań i obszary odpowiedzialności, organizacja pracy i wydajność, monitoring i usprawnienia. Kluczem do sukcesu projektu nie jest ścisłe i ślepe podążanie konkretną ścieżką, ale planowanie strategiczne i podejmowanie mądrych wyborów spośród całego wachlarza narzędzi i procesów mogących zapewnić realizację unikatowych celów i potrzeb każdej kolekcji. Przydatny będzie szczegółowy przewodnik w planowaniu projektu digitalizacyjnego to “A Framework of Guidance for Building Good Digital Collections”. Znajdują się tam dokładne informacje na temat tego co powinien zawierać plan budowy. Istnieje wiele metod planowania projektu, które formalizują ten proces i pozwalają na kontrolowanie realizacji. Najbardziej popularne metody planowania projektu to:
  • PRINCE2 (ang. PRojects IN Controlled Environment, version 2) - jest standardową metodą zarządzania projektem. Służy do organizowania, zarządzania i kontrolowania projektów związanych z różnymi dziedzinami. Jest często używany do zarządzania wielkimi projektami w departamentach i agencjach brytyjskiego rządu. (polski opis można znaleźć tutaj)
  • Przewodnik PMBOK (ang. Project Management Body of Knowledge) cieszy się międzynarodowym uznaniem, jest alternatywą dla PRINCE2. Zawiera zestaw wskazówek do zarządzania projektami, które mogą być wprowadzone w różnych dziedzinach, w tym w budownictwie, tworzeniu oprogramowania, motoryzacji, itp. (polski opis przewodnika można znaleźć tutaj)

Wybór schematu metadanych

Jak zostało już powiedziane, metadane to ustrukturyzowana informacja, która opisuje, umiejscawia, lub w jakikolwiek inny sposób upraszcza wyszukanie, użycie i zarządzanie zasobami cyfrowymi. Metadane są często nazywane danymi na temat danych albo informacjami o informacjach. Podstawą decyzji o wyborze standardu metadanych w projekcie biblioteki cyfrowej powinny być cele i założenia projektu. Ciężko podważyć ogromne znaczenie metadanych, dlatego w celu wyboru schematu metadanych opisujących obiekty cyfrowe, należy przeprowadzić dogłębną analizę. Schemat metadanych definiuje zestaw elementów metadanych, opisujących dany zasób, np. obiekt cyfrowy. Istnieją różne standardy związane z metadanymi, takie jak MARC (ang. Machine-Readable Cataloging format), Encoded Archival Description (EAD), Dublin Core Metadata Element Set (DCMES) czy też Categories for the Description of Works of Art (CDWA). Metadane są użyteczne, jeśli przy ich tworzeniu postępuje się zgodnie z tymi regułami/standardami. Aby biblioteki cyfrowe mogły współpracować na poziomie krajowym, konieczne było określenie wspólnego mianownika dla konwencji opisywania obiektów przyjmowanej przez różne polskie biblioteki cyfrowe. Dzięki nim, użytkownicy będą mogli dotrzeć do zasobów, których szukają i będą mogli z nich skorzystać. Podstawą dla funkcjonowania polskiej rozproszonej platformy bibliotek cyfrowych jest schemat metadanych Dublin Core (DCMES, tzw. „prosty Dublin Core”). Więcej o schemacie Dublin Core można znaleźć w tłumaczeniu schematu przygotowanym przez Bibliotekę Narodową. Oprócz polskiej wersji warto zapoznać się również z oryginalną specyfikacją i dokumentami towarzyszącymi dostępnymi na stronach Dublin Core Metadata Initiative http://dublincore.org. Od 2010 roku trwają prace nad stworzeniem nowego schematu, który mógłby zastąpić DCMES w polskich bibliotekach cyfrowych. Schemat ten nazywa się PLMET, a rozwojowa wersja jego dokumentacji znajduje się pod adresem: http://dl.psnc.pl/community/display/FBCMETGUIDE.

Przykład opisu obiektu cyfrowego

Wybór schematu to jedno, kolejny krok to określenie stopnia zaawansowania samego opisu. Im bardziej szczegółowy jest opis, tym łatwiej będzie użytkownikom odnaleźć dany zasób. Stworzenie takiego dokładnego opisu będzie wymagać jednak więcej wysiłku na etapie jego tworzenia. Poza poziomem szczegółowości, należy wziąć także pod uwagę kwestię związaną z dostępnością zasobów. Biblioteki cyfrowe funkcjonują w Internecie, gdzie ich zasoby są tak samo widoczne dla użytkowników z Polski jak i np. z USA. Polski użytkownik z łatwością poradzi sobie z wyszukiwaniem publikacji na dany temat, wpisując odpowiednie słowa kluczowe. Znajomość języka polskiego nie jest jednak tak popularna wśród Amerykanów. Aby uczynić obiekty składowane w bibliotece cyfrowej dostępnymi dla szerokiego spektrum internautów, warto rozważyć przygotowanie dwóch równoległych wersji opisu – w języku polskim i angielskim. Poniżej prezentujemy przykład pochodzący z biblioteki cyfrowej Politechniki Lubelskiej. Część elementów opisu została przetłumaczona na język angielski, dzięki czemu o wiele łatwiej będzie odnaleźć ten obiekt użytkownikom, którzy nie znają języka polskiego. 30c Ilustracja 31. Metadane obiektu w wersji polskiej 31c Ilustracja 32. Metadane obiektu w wersji angielskiej Zarówno udostępnianie opisu w schemacie Dublin Core jak i tłumaczenie go na język angielskie zwiększa szansę na to, że zasoby będą mogły być wykorzystywane przez inne usługi i użytkowników o których nie myśleliśmy w chwili tworzenia biblioteki cyfrowej. Taką zdolność do współpracy z zewnętrznymi usługami/użytkownikami nazywamy interoperacyjnością.

Inne kwestie

Wybór oprogramowania i określenie konwencji opisu obiektów to zaledwie ułamek zagadnień, które należy rozpatrzeć przy planowaniu i realizacji projektu tworzenia biblioteki cyfrowej. Inne kwestie jak np. wybór formatów cyfrowych dla konkretnych typów obiektów, kwestie doboru materiałów do konkretnych kolekcji czy zagadnienia związane z prawami własności intelektualnej zostały omówione w dalszych częściach kompendium. W przypadku wątpliwości zawsze warto poradzić się kogoś, kto w danej materii ma już pewno doświadczenie.

Uruchomienie biblioteki cyfrowej

Standardowe oprogramowanie do budowy bibliotek cyfrowych oferuje standardowy interfejs strony WWW biblioteki cyfrowej. Przed ostatecznym uruchomieniem należy tę stronę przystosować do potrzeb instytucji i przyszłych użytkowników. Chodzi nie tylko o sam wygląd portalu (dobór logotypu, tematu kolorystycznego), ale również kwestie związane z:
  • materiałami pomocniczymi – instrukcje, strony pomocy,
  • możliwością przesłania informacji zwrotnej – forum użytkowników, formularz kontaktu.
Podczas udostępniania użytkownikom końcowym obiektów cyfrowych na stronie internetowej biblioteki cyfrowej ważne jest, aby pamiętać o następujących rekomendacjach:
  • Sprawdzenie interfejsu użytkownika końcowego na początku, celem ostatecznego przemyślenia i ewentualnie dokonania ostatecznych poprawek.
  • Zaangażowanie użytkowników końcowych w trakcie projektowania i testowania interfejsu strony internetowej biblioteki cyfrowej.
  • Identyfikacja kwestii związanych z funkcjonalnością i dostępnością - rozważenie alternatywnych wersji np. tekstowych opisów zasobów wizualnych, transkrypcje nagrań dźwiękowych, streszczenia nagrań video.
  • Promocja kolekcji: pomocny może okazać się rozwój "marki", posiadanie strategii reklamowej, lub otwarcie swoich zasobów dla wyszukiwarek lub innych serwisów (np. dla protokołu Z39.50 lub OAI-PMH).

Promocja biblioteki cyfrowej

Ważną kwestią podczas uruchamiania biblioteki cyfrowej, jest public relations i strategia marketingowa. Właściwe przygotowanie strategii marketingowej i PR pomogą osiągnąć większy sukces w zakresie popularyzacji biblioteki cyfrowej i wykorzystania jej treści. Zwykle celem projektów z zakresu dziedzictwa kulturowego jest zwiększenie świadomości w gronie ich twórców, jak i użytkowników, określenie preferowanych użytkowników, których należałoby zachęcić do korzystania z rezultatów projektu, a także reklamowanie projektu przez kluczowe osoby życia publicznego i wreszcie przez wskazanie danych kontaktowych projektu. Włączenie zarówno tradycyjnego, jak i elektronicznego marketingu jest niezbędne, aby projekt stał się zauważalny w określonym środowisku. Tradycyjnie działania marketingowe mogą uwzględniać:
  • ulotki reklamowe, plakaty, dystrybucję gadżetów,
  • wystąpienia na różnych konferencjach związane z wprowadzaniem rozwiązań w zakresie projektów przygotowywania bibliotek cyfrowych,
  • dystrybucja informacji w lokalnych, krajowych lub międzynarodowych mediach,
  • oficjalne uruchomienie biblioteki cyfrowej i zaproszenie prominentnych gości do oficjalnego otwarcia projektu.
Oprócz tradycyjnego marketingu, powinien zostać wdrożony także marketing internetowy. Oznacza to udostępnianie informacji na stronie domowej, wysyłanie informacji e-mailem do użytkowników biblioteki, wpisy na blogu bibliotekarskim, posty na forum, stworzenie fanpage'a na facebooku, etc.

Dołączenie do istniejącego konsorcjum

Liczba zagadnień, którymi należy zająć się w przypadku samodzielnego budowania biblioteki cyfrowej jest bardzo duża. Prawdopodobieństwo niepowodzenia w przypadku braku wiedzy i doświadczenia jest bardzo wysokie. Jeżeli na którymś z etapów analizy bądź planowania powzięta zostanie decyzja o rezygnacji z samodzielnego budowania biblioteki cyfrowej, należy rozważyć przyłączenie się do którejś z istniejących bibliotek cyfrowych. To, coo w tej kwestii zrobimy, zależy od typu zasobów jakie chcemy udostępnić i od tego czym ogólnie zajmuje się instytucja lub z kim współpracuje. Może to być, zależnie od przypadku, biblioteka regionalna (np. Śląska Biblioteka Cyfrowa) lub też repozytorium tematyczne (np. Cyfrowe Archiwum Agnieszki Osieckiej), do którego dana instytucja będzie pasowała. Przykładem biblioteki, w której zasoby udostępnia wiele instytucji związanych z danym rejonem/tematyką, jest Śląska Biblioteka Cyfrowa. Celem tego repozytorium jest prezentacja w internecie kulturowego dziedzictwa Śląska w jego historycznej i współczesnej różnorodności, publikowanie naukowego dorobku regionu oraz wspieranie działalności dydaktycznej i edukacyjnej. Adres biblioteki: http://www.sbc.org.pl/. 32c Ilustracja 33. Strona główna Śląskiej Biblioteki Cyfrowej. Powstanie ŚBC zainicjowało założycielskie Porozumienie o współpracy przy utworzeniu Śląskiej Biblioteki Cyfrowej z 20 lipca 2006 r. pomiędzy Biblioteką Śląską a Uniwersytetem Śląskim, mające na celu głównie wypracowanie zasad otwartego uczestnictwa innych śląskich instytucji. Każdy z Uczestników ŚBC zachowuje prawa do cyfrowej publikacji i decyduje np. o okresie jej udostępniania. Lista instytucji współpracujących z tą biblioteką znajduje się na tej stronie. W przypadku tego typu współpracy, instytucja przewodząca konsorcjum bibliotek oferuje często szkolenia w zakresie digitalizacji i katalogowania zgodnie z uznanymi przez wszystkich konsorcjantów zasadami. Dostępne są także środki, umożliwiające komunikację między uczestnikami konsorcjum, które mogą być wykorzystane w sytuacji, gdy zaistnieją jakiegoś rodzaju wątpliwości.