Jak odczytać format DjVu?

w dziale Archiwum/Czytelnik XXI wieku by

Temat najpopularniejszych formatów takich jak EPUB czy MOBI oraz informacje dotyczące digitalizacji książek zostały już przez nas poruszone. Tym razem przedstawimy wam trochę mniej znany, ale nadal wykorzystywany (przede wszystkim w bibliotekach) format plików, jakim jest DjVu. Jego niepodważalną zaletą jest możliwość skanowania dokumentów zawierających i tekst, i obraz. Umożliwiają to zaawansowane algorytmy kompresujące. Pozwala to na dokładne odwzorowanie wyglądu i treści oryginalnej, książkowej wersji.

Co to jest DjVu?

DjVu jest to komputerowy format plików przeznaczony do przechowywania zeskanowanych dokumentów (szczególnie tych, które zawierają połączenie tekstu, rysunków, obrazów kolorowych czy fotografii). Pliki zapisywane w takim formacie mają rozszerzenie „djvu” albo „djv”. Celem twórców było umożliwienie stworzenia jak najlepszych bibliotek cyfrowych, w których książki mogłyby być przechowywane na elektronicznych nośnikach. Stworzenie DjVu było podyktowane koniecznością powstania takiego formatu, który umożliwia przechowywanie zeskanowanego tekstu w jakości odpowiadającej oryginalnej papierowej wersji przy jednoczesnym zachowaniu dosyć małego rozmiaru pliku. Otrzymane pliki można otwierać za pomocą programów open source, a także ich płatnych odpowiedników.

Jak powstało DjVu?

DjVu zostało stworzone jako alternatywa wobec formatu PDF. Z powodu swoich zaawansowanych algorytmów jest lepiej przystosowany do skanowania dokumentów, które łączą w sobie tekst i obraz. Takie pliki będą też znacznie bardziej kompaktowe niż pliki PDF, a przez to bardziej wydajne. Metoda była rozwijana przez pracowników amerykańskiego AT&T Labs. Oprogramowanie oparte na kupionych od nich patentach stworzyła pod koniec lat 90. ubiegłego wieku amerykańska firma LizardTech Inc. Ostatnia wersja tego formatu ukazała się w 2006 roku. Mimo że DjVu nie jest już w znaczący sposób rozwijane, to liczba plików ukazujących się w tym formacie wciąż rośnie. Powszechność występowania spowodowana jest głównie kompaktowym rozmiarem plików oraz czytelnym odwzorowaniem zarówno tekstu, jak i obrazów. Pliki w DjVu są używane przede wszystkim do digitalizacji zasobów bibliotecznych, ponieważ oddają bardzo dobrze oryginalny tekst wraz ze wszystkimi śladami znajdującymi się na papierze np. plamami po kawie czy notatkami na marginesach.
Format DjVu opiera się przede wszystkim na dosyć zaawansowanej metodzie segmentacji obrazu. Tworzenie pliku w tym formacie polega na rozdzielaniu obrazu na osobne warstwy. Potem warstwy poddawane są oddzielnie optymalizacji i kompresji.

Jak odczytać format DjVu?

Najszybszym sposobem na otworzenie takiego pliku jest skonwertowanie go do formatu PDF i otworzenie otrzymanego pliku. Można do tego celu użyć konwerterów online, nie trzeba ich instalować ani za nie płacić.
Dobrym sposobem jest zainstalowanie wtyczki do Internet Explorer albo Chrome ze strony www.cuminas.jp. Znajdziemy tam oficjalną przeglądarkową wtyczkę, która umożliwi nam otwieranie w przeglądarce tego formatu plików. Wtyczka została napisana w języku HTML 5 i umożliwia przeglądanie tego typu plików. Strony można przewijać i powiększać, nie można jednak wyszukiwać tekstu.
Aby pobrać wtyczkę należy wejść na stronę https://www.cuminas.jp/en/ i kliknąć przycisk „Download”.

Następnie wybrać „DjVu Browser Plug-in”

i pobrać wersję 32 albo 64 bitową

W momencie, kiedy znajdziemy się np. na stronie biblioteki posiadającej pliki w formacie DjVu, możemy wybrać, w jaki sposób chcemy je przeglądać. Aby to zrobić należy kliknąć w przycisk „Więcej…” na żółtym buttonie w prawym dolnym rogu.

Publikacja pochodzi z zasobów Kujawsko Pomorskiej Biblioteki Cyfrowej
Publikacja pochodzi z zasobów Kujawsko Pomorskiej Biblioteki Cyfrowej

Po kliknięciu będzie można wybrać, w jaki sposób chcemy wyświetlić treść publikacji

Dla przeglądarki Firefox działa tylko wybór HTML 5.
Teraz można już swobodnie przeglądać publikacje.

Publikacja pochodzi z zasobów Kujawsko Pomorskiej Biblioteki Cyfrowej
Publikacja pochodzi z zasobów Kujawsko Pomorskiej Biblioteki Cyfrowej
Przykładowe programy do odczytywania plików DjVu

Można również zainstalować programy stworzone do odczytywania tego rodzaju plików, szczególnie dużych dokumentów. Takich programów jest wiele, najpopularniejsze z nich to:
DjView – jeden z lepszych i łatwiejszych w obsłudze programów do odczytu plików w formacie DjVu. Jest dostępny całkowicie za darmo dla Windowsa, Linuxa i Maca. Pozwala nie tylko na przeglądanie pliku, ale również na przeszukiwanie dokumentu i wyświetlanie numeru strony.
Sumatra Reader – mało znany program, dostępny tylko dla Windowsa. Oprócz odczytu wspiera podstawowe operacje edycji dokumentu.
STDU Viewer – darmowy do użytku edukacyjnego oraz niekomercyjnego, dostępny w różnych wersjach językowych
Ebookdroid – to program do odtwarzania plików DjVu na Androida. Dzięki temu można przeglądać tego typu pliki również na smartfonach.

Mimo że jest to format nieco już zapomniany, to warto mieć świadomość jego istnienia i wykorzystywania w digitalizacji zasobów, zwłaszcza bibliotecznych. Okazuje się przydatny, zwłaszcza gdy potrzebujemy skany dużych publikacji, a nie samego tekstu.

Martyna Gancarczyk

O autorce artykułu

Z wykształcenia menadżer kultury. Uwielbia mieć dobrą książkę zawsze pod ręką. Wielka entuzjastka horrorów zarówno jeśli chodzi o literaturę, kinematografię, jak i gry. Dzień bez książki lub filmu to dzień stracony. Oprócz tego miłośniczka zwierząt, szczególnie psów (a zwłaszcza własnego).