3.230.162.34abc

Jak pobrać wyłącznie warstwę tekstową publikacji - FBC - Pytania i odpowiedzi
  • Rejestracja

Jak pobrać wyłącznie warstwę tekstową publikacji

0 głosów

Chciałbym będąc zwykłym gościem biblioteki cyfrowej opartej o ślinik dLibra 5.x pobrać wyłącznie warstwę tekstową publikacji.

Kiedyś było to proste. Nawet Google podpowiadało. Dla przykładu używając takiego url ebuw.uw.edu.pl/dlibra/plain-content?id=XXX (gdzie XXX to numer publikacji) wyświetlał się czysty tekst. Teraz wraz z kolejnymi aktualizacjami ślinika biblioteki już tak się nie dzieje.

Jak należy spreparować Request do serwera aby wyświetlić tylko czysty tekst publikacji?

pytanie zadane 10 listopada 2013 w Funkcjonowanie bibliotek cyfrowych przez użytkownika Aleksander Górski (120)
    

1 odpowiedź

0 głosów
Musi się Pan przedstawić serwerowi (zmieniając User Agenta) jako Google lub inna popularna wyszukiwarka.
odpowiedź 12 listopada 2013 przez użytkownika Marcin Werla (2,060)
Dziękuje za szybką odpowiedz. Faktycznie tak się da ale działa trochę wybiórczo. W przypadku eBUW tekst wyświetla się tylko dla dawniej dodanych publikacji a w WBC wszystko działa jak trzeba nawet dla ostatniej dodanej publikacji.

Swoją drogą szkoda, że nie ma guzika tylko trzeba tak kombinować
To ciekawe. Powinno działać niezależnie od daty dodania. Mogę prosić o kilka przykładów publikacji dla których nie działa?
Oczywiście. W tej chwili publikacją z najwyższym ID (http://ebuw.uw.edu.pl/dlibra/docmetadata?id=135332) jest "Echo. R. 7, 1883, nr 290". Jeśli wejdziemy na taki URL (oczywiście zmieniając User Agent) ebuw.uw.edu.pl/dlibra/plain-content?id=135332 otrzymamy pustą białą stronę. Testowałem tak na chybił trafił ale zmniejszając wartość ID o jakieś o jakieś 33-34tyś dopiero zaczęła się wyświetlać warstwa tekstowa.

Testowałem w FF 25.0
Problem zloszono do administratora e-bUW. Zywie nadzieje, ze nie jest to problem naszje "instalcji"....
Dziękuje za szybką interwencje. Przy okazji pozwolę sobie zgłosić jeszcze jedną niedogodność w działaniu tego mechanizmu w eBUW.

Od razu powiem, że sprawdziłem to kilkoma przeglądarkami zmieniając User Agent. Zawsze jest tak samo.

Dla wielu publikacji starszych url ebuw.uw.edu.pl/dlibra/plain-content?id=XXX również nie działa. Tylko przerzuca na stronę opisu wydania danej publikacji.

Kilka przykładów:

(Gazeta Warszawska. 1805, nr 75 + dod.)
http://ebuw.uw.edu.pl/dlibra/plain-content?id=61701 przerzuca na http://ebuw.uw.edu.pl/dlibra/docmetadata?id=61701

(Gazeta Warszawska. 1804, nr 78 + dod.)
http://ebuw.uw.edu.pl/dlibra/plain-content?id=61601 przerzuca na http://ebuw.uw.edu.pl/dlibra/docmetadata?id=61601

(Gazeta Warszawska. 1809, nr 58 + dod.)
http://ebuw.uw.edu.pl/dlibra/plain-content?id=61801 przerzuca na http://ebuw.uw.edu.pl/dlibra/docmetadata?id=61801

Jak widać ID raz o 100 większe a raz o 100 mniejsze i tak warstwy tekstowej brak. Dla ID=61802 jest i znowu dla 61803 nie ma.

Jak się tak popróbuje to strasznie dużo takich "braków" wychodzi.
Dziekuje, za informacje. Oczywiscie informacje przekazuje dalej = informatyk ebUW, jednak czy moze Pan powiedziec: z problemami, o ktorych mowa wyzej mial Pan tylko w naszej BC, czy moze tez w jakiejs innej bibliotece?
AW
Przyznam, że w kręgu moich zainteresowań głównie jest eBUW i jego zbiory dlatego tak go dokładnie "badam". Sprawdziłem jeszcze dwie inne biblioteki na razie tak bardzo bardzo pobieżnie i nie zauważyłem problemów ...
"Przyznam, że w kręgu moich zainteresowań głównie jest eBUW" cieszymy sie bardzo :D

Informacja , ktora Pan podal w poprzedniej wiadomosci jest o tyle istotna, ze gdy problemy nie sa powtarzalne w innej bibliotece, moga wskazywac na problemy e-bUWu :(((

Przeprowadzilam rozmowe z administratorem naszej BC, bedzie sie problemowi przygladal wnikliwie. Zywie nadzieje, ze znajdzie rozwiazanie...

Moja prosba: prosze o dalsze wnioski na adres: ebuw@uw.edu.pl

AW
...