18.206.48.142abc

Czy format djvu musi byc wykorzystywany w bibliotekach cyfrowych? - FBC - Pytania i odpowiedzi
  • Rejestracja

Czy format djvu musi byc wykorzystywany w bibliotekach cyfrowych?

+2 głosów
Mam pytanie czy format djvu musi byc wykorzystywany w bibliotekach cyfrowych? Czy nie mozna wykorzystac czegos latwiejszego dla uzytkownika? Z djvu jest problem na komorkach, tabletach i pcetach i wszystkim innym (instalacja wtyczki i samo korzystanie z wtyczki). Zdecydowanie wole pliki pdf albo obrazki.
pytanie zadane 7 lutego 2013 w Funkcjonowanie bibliotek cyfrowych przez użytkownika niezalogowany
    

4 odpowiedzi

+2 głosów

Polecam publikację Bartka Siedlarza w której wyjaśnia wiele zagadnień związanych z publikowaniem w bibliotekach cyfrowych. Na stronie - http://jbc.bj.uj.edu.pl/Content/180331/bspm.djvu?djvuopts&page=28 są omówione formaty stosowane w BC oraz ich zalety i wady. Generalnie nie ma jednego uniwersalnego formatu, który byłby najlepszy dla wszystkich typów publikacji.

Polecam też prezentację Marka Kolasy - Formaty hybrydowe w bibliotekach cyfrowych : kontekst i praktyka

Format DjVu faktycznie jest mało mobilny i mało popularny, ale posiada wiele zalet zwłaszcza gdy publikujemy skany obszernych publikacji a nie sam tekst. Zadośćuczynieniem na problemy z formatem DjVu mogłoby być wprowadzenie do BC wieloformatowości publikacji, co dyskutowane jest tutaj - Publikacje dostępne w kilku formatach - nowa funkcja w dLibrze?, ale nie rozwiąże to wszystkich problemów ponieważ to od organizatorów BC zależy jak będą przygotowywać obiekty w bibliotekach cyfrowych.

odpowiedź 7 lutego 2013 przez użytkownika Tomasz Kalota (720)
Biblioteki na zachodzie korzystają z plików JPEG2000 albo PDFów i jakoś nie mam problemu z korzystaniem z nimi. Dawno temu kiedy sieć była wolna to może i każdy kilobajt się liczył, ale czy teraz faktycznie jest to tak ważne? Podane publikacje (wspołczesne, a też w DjVu....) nie przekonują mnie do tak dużej popularności DjVu. Czy nie lepiej jednak, jeżeli będzie jeden prosty w obsłudze format typu PDF czy JPEG zamiast męki z trochę mniejszym DjVu?
Nie chcę się upierać i twierdzić, ze DjVu jest najlepszy na świecie, bo tak nie jest. Podam tylko dwa przykłady publikacji na których będzie można poznać zalety i wady dwóch formatów przy dzisiejszych możliwościach technologicznych.

1. http://www.bibliotekacyfrowa.pl/publication/37046 - publikacja przygotowana w formacie PDF.

2. http://www.bibliotekacyfrowa.pl/publication/31994 - publikacja przygotowana w formacie DjVu

Poza szybkością otwierania publikacji istotna jest jeszcze jakość plików graficznych. Osobiście  do tworzenia współczesnych opracowań wolę PDF bo daje więcej możliwości edytorskich, nawigacyjnych itp. Nie uważam jednak żeby ten format był najlepszy w każdym przypadku. Największym problemem DjVu jest jego mała popularność oraz polityka marketingowa korporacji takich jak Adobe czy Google.
+2 głosów
Popularność DjVu w Polsce wynika po części z zaszłości historycznych. 10 lat temu (kiedy polskie BC dopiero się rozkręcały) przepustowość łączy internetowych była odwrotnie proporcjonalna do wielkości entuzjazmu, z jakim instytucje zaczęły digitalizować. DjVu i jego rewolucyjne możliwości sprawiły, że ten i ów w ogóle zdecydował się rozpocząć przygodę z BC. Powstały konsorcja, wielkie projekty i stosowanie formatu DjVu zalecano jako dobrą praktykę. No a potem - siłą rozpędu - utarło się, że to właściwie podstawowy format dla potrzeb udostępniania dokumentów piśmienniczych on-line.

Realia technologiczne ostatnimi czasy radykalnie się zmieniły, ale nie ma co oczekiwać, że polskie BC zareagują równie dynamicznie. Na przestrzeni lat w pracowniach digitalizacyjnych dopracowano algorytmy postępowania przy wytwarzaniu obiektów cyfrowych, co w wielu przypadkach pociągnęło za sobą spore koszty (bo taki DocumentExpres Enterprise kosztuje fortunę), więc nie wydaje mi się, żeby nagle to wszystko zarzucono. Niemniej zgadzam się z P. Tomaszem, że mnogość formatów do wyboru byłaby tu doskonałym rozwiązaniem. Chociaż, znając życie, sprawa będzie dotyczyła zbiorów, które dopiero będą umieszczane w BC w przyszłości, bo szczerze wątpię, czy komuś będzie się chciało bawić w dorabianie alternatywnych formatów do już od dawna istniejących DjVu.
odpowiedź 7 lutego 2013 przez użytkownika Olek Trembowiecki (300)
To, że realia technologiczne się zmieniły nie oznacza, że trzeba robić technologiczny krok do tyłu (chociaż z doświadczenia wiemy, że i takie rzeczy się zdarzają).
Juz 10 lat temu widziałem w tym problem i uwazałem za głupote (bedac na studiach historycznych forsowanie tego formatu zamiast pdf.
Ale rąsia rąsię myje i tu chodzi o instytucjonalne nakazy i ustalenia, a nie logikę.
+1 głos

Czy DjVu musi być wykorzystywany w bibliotekach cyfrowych?

Oczywiście, że nie musi — aczkolwiek powinien — głównie w dwóch przypadkach: 1. dokumenty zdigitalizowane (ze względu na warstwowanie i zyski z tego wynikające, czyli zwiększoną czytelność oraz upakowanie, a także możliwości użycia poszczególnych warstw osobno); 2. dokumenty składane cyfrowo (ultrawydajna kompresja + zero problemów z renderowaniem).


Z djvu jest problem na komorkach, tabletach i pcetach i wszystkim innym (instalacja wtyczki i samo korzystanie z wtyczki).

Zwrócić pragnę uwagę na bardzo często ignorowaną rzecz: do PDF też konieczna jest wtyczka. Czymże to różni się więc od obsługi DjVu? Jeżeli przyjrzeć się kłopotom, które występują z PDF-ami i do nich przeglądarkami, to naprawdę nie ma co narzekać na DjView, a tym bardziej na DjVuViewera. Nie wiem kim niezalogowany niezadowolony użytkownik jest, ale jeżeli pamięta, co było jakiś czas temu w sieci z PDF-ami, na których nadmierne rozpanoszenie się użytkownicy (włącznie ze mną) klęli siarczyście dniami i nocami, to nie ma się czego obawiać: wsparcie się kiedyś pojawi i będzie coraz wygodniej.


Biblioteki na zachodzie korzystają z plików JPEG2000 albo PDFów i jakoś nie mam problemu z korzystaniem z nimi.

JPEG2000 ostatnio na topie: mnóstwo ludzi o tym rozprawia i niezdrowo się podnieca, a podejrzewam, że 90% z nich nie wie co to jest i jak to się w praktyce sprawdza. A użytkownicy to już w ogóle z JPEG2000 styczności bezpośredniej nie mają i mieć nie będą raczej. A z PDF-ami było tak, że ktoś kiedyś, w zamierzchłych czasach, gdy nie było alternatywy, wpadł na pomysł, by pakować obrazki w kontener i serwować tak: pomysł niezły, wykonanie średnie, problemów dużo. Po to właśnie powstało DjVu, żeby te problemy rozwiązać, i od tego czasu życie osób przygotowujących dokumenty stało się łatwiejsze, biblioteki cyfrowe tańsze w utrzymaniu, a użytkownicy zaawansowani bardziej szczęśliwi.


Czy nie lepiej jednak, jeżeli będzie jeden prosty w obsłudze format typu PDF czy JPEG zamiast męki z trochę mniejszym DjVu?

Nie lepiej. Formaty dedykowane są do specyficznych zastosowań, co podkreślił Tomek. Dobrze by było, gdyby PDF i DjVu używane były do tego, do czego są przeznaczone i w czym się sprawdzają dobrze. Użytkownicy powinni być w stanie każdy dokument otworzyć i bez problemów skorzystać z niego (oprogramowanie dla większości platform istnieje, a ja gorąco zachęcam użytkowników do zdobywania wiedzy i samodoskonalenia w tym zakresie także). W zasadzie PDF i DjVu (a także inne formaty umozliwiające zapis dokumentów stronicowanych) mają więcej podobieństw niż różnic: i z punktu widzenia odbiorcy byłyby prawie tożsame, gdyby były serwowane w taki sam sposób. Niestety nie są, ale to może zmienić się w przyszłości. Ja zalecam jedno: nakłaniać do wsparcia i propagować, zamiast walczyć z formatami.


Dawno temu kiedy sieć była wolna to może i każdy kilobajt się liczył, ale czy teraz faktycznie jest to tak ważne?

Teraz też się liczy. Szczególnie w publicznych instytucjach, gdzie wydawane są publiczne pieniądze. Poza tym DjVu nie oznacza jedynie ogromnej kompresji i słabej jakości. Wbrew temu, co w społeczeństwie krąży, jest to dość elastyczny format i wiele, wiele można z nim zrobić — o ile się potrafi.

 

odpowiedź 7 lutego 2013 przez użytkownika Bartłomiej Siedlarz (760)
edycja 7 lutego 2013 przez użytkownika Bartłomiej Siedlarz
Coś mi mówi, że osobie zadającej "tytułowe" pytanie chodziło głównie o nieprzystawanie DjVu do urządzeń mobilnych. O ile tablety i smartfony są średnim przykładem (przynajmniej w przypadku Androida, który posiada stosowną wtyczkę - nie wiem, jak sprawa wygląda w iOS), to problem jest faktycznie spory, gdy weźmiemy pod uwagę czytniki e-booków. Jeśli w ogóle obsługują DjVu (rzadkość), to wygląda to fatalnie. Tymczasem PDFy mogą być przez te urządzenia całkiem sprawnie "zdeformatowane", przez co łatwiej się je czyta. Tylko tu pojawiają się dwie kwestie. Pierwsza - dotyczy to PDFów wygenerowanych z dokumentów born-digital lub otrzymanych w wyniku głębokiej digitalizacji. Druga - ile takich dokumentów jest w naszych BC? Promil? W takich konkretnie przypadkach użycie PDF jako formatu podstawowego trudno uznać za krok w tył.

Odnośnie JPEG2000 - być może jest to jeszcze format przyszłości, ale już bardzo szanujące się instytucje używają go jako formatu archiwalnego. Nie ukrywam, że jestem wciąż sceptycznie nastawiony ze względu na ew. dalsze konwersje do innych formatów oraz - co najważniejsze - brak możliwości zmodyfikowania grafiki w JPEG2000 lossless, a następnie zapisania w tym samym formacie, też w wersji lossless.
@Olek Trembowiecki
(...) O ile tablety i smartfony są średnim przykładem (przynajmniej w przypadku Androida, który posiada stosowną wtyczkę - nie wiem, jak sprawa wygląda w iOS), to problem jest faktycznie spory, gdy weźmiemy pod uwagę czytniki e-booków. (...)

Czytniki ebooków wymagają głównie tekstu a tego problemu nie rozwiąże zastosowanie samego PDFa. Zgoda że łatwiej się konwertują na ePUB czy MOBI, ale PDFy z brudnym OCRem są mało użyteczne, a oglądanie PDFów na czytniku jako obrazków stron mało wygodne.
Czy w dLibrze potrzebna jest automatyczna konwersja plików prezentacyjnych?
I właśnie dlatego napisałem, że PDFy sprawdzają się na czytnikach e-booków, o ile są wygenerowane z dokumentów born-digital (i ktoś przy tym nie namieszał z polskimi znakami). Wtedy nie ma miejsca na wskazany przez Pana problem OCRu ani obrazów stron - jedyną grafiką w takich plikach są elementy graficzne w oryginale towarzyszące tekstowi. Poza tym nie napisałem nigdzie, że PDF jest jedynym słusznym rozwiązaniem, ale dla czytników jest na pewno wygodniejszy w obsłudze niż DjVu.
Pełna zgoda :-), ja trochę uprościłem odpowiedź żeby zaakcentować problem OCRu.

To co Tomek Parkoła zaproponował z automatyczną konwersja wydaje się być słuszną koncepcją. Nie rozwiąże wszystkich problemów ale może być bardzo pomocne.
Generalnie jest to problem sposobu sporządzania dokumentów, nie formatu. A konieczność ustalenia pewnych aspektów teoretycznych w zakresie dokumentów cyfrowych istnieje i zapewne coś z tym w najbliższej przyszłości będziemy robić.
Pomału coraz więcej osób korzysta z urządzeń mobilnych ( np. z Androidem ) Jak ktoś chce tylko przeglądać dane z internetu, to tablet jest wprost idealny. Zamiast wydawać kilka tysięcy na laptop czy komputer można wydać kilkaset złotych na tablet, albo w ostateczności 200 zł na przystawkę z androidem do KAŻDEGO telewizora z wejściem  scart. A to w znacznym stopniu rozszerzyłoby liczbę osób korzystających z bibliotek cyfrowych. Kto tego nie widzi jest kilka lat do tyłu. Przepraszam, jeżeli kogoś uraziłem, ale w rodzinie mam ten problem. Starsza osoba, dla której przeglądanie BC stanowi ciekawe zajęcie ma właśnie tablet. I NIE MOŻE Z NIEGO W PEŁNI KORZYSTAĆ bo ktoś wprowadził "śmieszne ograniczenie". Musi czekać aż znajdę czas i przyjdę w odwiedziny z laptopem.
Przepraszam, oczywiscie wejście HDMI do TV
+1 głos

Ciekawym uzupełnieniem odpowiedzi na postawione pytanie może być ten wątek na forum Biblioteka 2.0 - http://forum.biblioteka20.pl/viewtopic.php?t=821

odpowiedź 16 lutego 2013 przez użytkownika Tomasz Kalota (720)
...