Что такое формат DjVu
Что такое дежа вю? Нет, это не только психологическое состояние, когда вам кажется, что вы что-то подобное уже видели, или были в подобной ситуации. Это так же формат файлов DjVu – графический формат, который используется преимущественно для сохранения и сжатия отсканированных книг, содержащих цветные изображения и текст. Что такое дежа вю? Нет, это не только психологическое состояние, когда вам кажется, что вы что-то подобное уже видели, или были в подобной ситуации. Это так же формат файлов DjVu – графический формат, который используется преимущественно для сохранения и сжатия отсканированных книг, содержащих цветные изображения и текст. В последние несколько лет в Интернете произошел бум, когда везде стали появляться книги и журналы в этом необычном формате, открывались целые библиотеки. Что же это за формат? В чем его преимущества или недостатки, например, перед форматом PDF? И как просматривать такие файлы? Обо всем этом вам расскажет данная статья.
Однако постепенно новый формат стал проникать в интернет, где постепенно стал занимать свою нишу, отодвигая в сторону гиганта PDF. Для пользователей интернета с небольшим каналом, лимитированным трафиком – это был идеальный вариант.
Что же представляет собой Дежа Вю? Это способ сжатия графических изображений с потерей данных, который поддерживает многостраничность документов. Его особенность заключается в том, что изображение перед сжатием разбивается на два или три слоя, отдельно текст и картинки. Затем эти слои проходят первоначальное сжатие, картинки сжимаются больше, так как потеря их качества не сильно влияет на конечный результат, текст практически не сжимается для обеспечения максимального качества. Далее полученный результат пережимается с использованием новых кодеков – IW44 и JB2. В кодеке IW44 используются вейлветы (волны), благодаря чему он обеспечивает соотношение размер/качество в два и более раз лучше, чем формат JPEG, используемый в PDF.
В итоге обычная полноцветная страница с текстом с разрешением 300 точек на дюйм (dpi) в среднем имеет размер 50 кб, что позволяет использовать документы в формате DjVu во внутреннем документообороте компаний и в Интернете.
МирСоветов считает необходимым сказать отдельно о тексте в документах DjVu. Данный формат поддерживает возможность добавления слоя с распознанным текстом (OCR). Несмотря на определенные трудности и затраты труда на его создание, а также тот факт, что наличие этого слоя увеличивает размер файла, он несет в себе дополнительные удобства для пользователей. Так, при наличии OCR слоя текст можно выделять, копировать и вставлять в текстовый редактор, можно экспортировать текст в отдельный файл. При этом текст не имеет форматирования, то есть при вставке его, например, в Word, вы получите кусок неоднородного текста, часто с различными лишними элементами (различные значки, нечитаемые символы). Также при наличии распознанного текста есть возможность поиска по тексту документа.
Подведем небольшой итог, подсчитаем достоинства и недостатки формата DjVu и посмотрим, что у нас получится.
Плюсы:
Серьезным препятствием на пути развития DjVu является и тот факт, что PDF уже на протяжении многих лет используют в различных сферах, и этот формат стал эталоном документооборота. Различные руководства пользователей, документы распространяются в формате PDF. Тем не менее, новая технология прогрессирует и постепенно завоевывает свое место на рынке и в сердцах пользователей Интернета.
И самые свежие новости из мира DjVu от МирСоветов. 1 июля 2008 года компания Celartem Technology Inc., поставщик программных решений для хранения, просмотра и распространения мультимедийных материалов, а также материнская компания, отделением которой является компания LizardTech, анонсировала создание нового центра по продажам и управлению DjVu, который разместился в Сиэтле, штат Вашингтон (США). Соответственно теперь в Интернете поддержка формата осуществляется не с сайта компании LizardTech (http://www. lizardtech. com), а с сайта Celartem Technology Inc. (http://www. celartem. com).
При работе с форматом DjVu можно:
Стандартный набор функций. Имеются различные режимы просмотра, зум, вывод на печать и возможность сохранения страниц в формате BMP (например, для дальнейшего использования в программе FineReader). Простой и удобный интерфейс.
Отдельные части страницы можно выделять и копировать как картинку.
При работе с текстовым слоем не очень удобно сделан поиск. Хотя он и обладает рядом настроек и успешно справляется со своими функциями, но не позволяет вывести все найденные результаты в виде ряда закладок. Найденные результаты приходится просматривать по одному. Зато очень хорошо работает выделение текста. В отличие от других представленных в обзоре программ, творение LizardTech копирует текст с наименьшим количеством «мусора» (различных значков, нечитаемых символов), поэтому результат требует меньше затрат на редактировании в текстовом редакторе.
Как и другие программы представленные в обзоре (кроме DjVu FancyViewer) имеет полезную функцию – масштаб по выделению. Выбираем эту команду и выделяем часть страницы – в следующее мгновение она будет увеличена.
Но программа не лишена недостатков. Сильно раздражает отсутствие скроллинга внутри документа (работает только внутри каждой страницы по отдельности), не хватает возможности делать закладки.
Есть различные настройки, в том числе по коррекции изображения (яркость, контраст, гамма)
При работе с текстовым слоем (OCR) можно выделять часть текста, копировать, осуществлять удобный поиск, а также экспортировать весь текст в отдельный файл (txt). Можно выделить часть текста (заливкой, рамкой), делать закладки.
Кроме масштабирования по выделению WinDjView имеет еще одну интересную функцию, связанную с режимом увеличения. В этом режиме по нажатию левой кнопки мыши, можно увидеть увеличенное изображения части страницы, будто вы рассматриваете ее под лупой.
Отдельные страницы можно экспортировать в формат BMP.
Данная программа обеспечивает наиболее комфортную работу с текстом, естественно, при наличии текстового OCR слоя. Здесь есть возможность выделять фрагмент текста и копировать его в буфер, с последующей вставкой в текстовый файл. Для выделения всего текста в документе достаточно выделить небольшой фрагмент в начале и нажать «End». Очень удобная система поиска, имеющая полезные настройки (учитывать регистр, только слово целиком). Результат поиска выдается в виде списка с закладками: в первой колонке указан номер страницы, во второй – отрезок текста с искомым словом. Двойной клик на любой из закладок переводит на нужную страницу, предложение с искомым словом выделено цветом.
Есть также возможность настройки яркости, контраста и гаммы изображения, опция не очень востребованная, но крайне полезна при просмотре документов не в самом лучшем качестве. При этом минусом является отсутствие возможности отображения отдельных слоев изображения (цветного, черно-белого, переднего и заднего фона).
Мой выбор – именно эта программа. Лучшее сочетание компактности, удобства и функциональности. И естественно – поддержка русского языка!
Полностью отсутствует возможность работы с текстом, нет вывода на печать. Никаких дополнительных настроек. С другой стороны, программа очень проста и вполне подойдет человеку, который не хочет разбираться в большом количестве настроек и функций, а хочет просто открыть и просмотреть документ или книгу. Так как ничего больше сделать в этой программе не получится.
В целом функциональность утилит не сильно отличается. Поэтому при выборе программы для просмотра книг и документов в формате DjVu стоит обратить внимание на язык интерфейса, необходима ли установка (незачем засорять компьютер и реестр, если есть возможность этого не делать) и на размер установочного файла программы. Хотя все конечно зависит от того, зачем эта программа нужна человеку, и что именно он собрался в ней делать.
Что такое DjVu
12 лет назад компания AT&T Labs впервые объявила о создании нового формата графических изображений, который получил название DjVu. Первоначальной целью его создания было ведение электронного документооборота. Несмотря на то, что уже существовал формат PDF, он не устраивал прежде всего размерами готовых файлов. Компаниям для ведения внутреннего документооборота был необходим формат, который бы имел небольшой размер и при этом очень хорошее качество, особенно хорошую читаемость текста и мог передавать все детали документа (его текстуру, потертости, повреждения и т. д. ).Однако постепенно новый формат стал проникать в интернет, где постепенно стал занимать свою нишу, отодвигая в сторону гиганта PDF. Для пользователей интернета с небольшим каналом, лимитированным трафиком – это был идеальный вариант.
Что же представляет собой Дежа Вю? Это способ сжатия графических изображений с потерей данных, который поддерживает многостраничность документов. Его особенность заключается в том, что изображение перед сжатием разбивается на два или три слоя, отдельно текст и картинки. Затем эти слои проходят первоначальное сжатие, картинки сжимаются больше, так как потеря их качества не сильно влияет на конечный результат, текст практически не сжимается для обеспечения максимального качества. Далее полученный результат пережимается с использованием новых кодеков – IW44 и JB2. В кодеке IW44 используются вейлветы (волны), благодаря чему он обеспечивает соотношение размер/качество в два и более раз лучше, чем формат JPEG, используемый в PDF.
В итоге обычная полноцветная страница с текстом с разрешением 300 точек на дюйм (dpi) в среднем имеет размер 50 кб, что позволяет использовать документы в формате DjVu во внутреннем документообороте компаний и в Интернете.
МирСоветов считает необходимым сказать отдельно о тексте в документах DjVu. Данный формат поддерживает возможность добавления слоя с распознанным текстом (OCR). Несмотря на определенные трудности и затраты труда на его создание, а также тот факт, что наличие этого слоя увеличивает размер файла, он несет в себе дополнительные удобства для пользователей. Так, при наличии OCR слоя текст можно выделять, копировать и вставлять в текстовый редактор, можно экспортировать текст в отдельный файл. При этом текст не имеет форматирования, то есть при вставке его, например, в Word, вы получите кусок неоднородного текста, часто с различными лишними элементами (различные значки, нечитаемые символы). Также при наличии распознанного текста есть возможность поиска по тексту документа.
Подведем небольшой итог, подсчитаем достоинства и недостатки формата DjVu и посмотрим, что у нас получится.
Плюсы:
- главный плюс – это, безусловно, небольшой размер;
- при небольшом размере файла сохраняется хорошее качество изображений и особенно текста;
- обрабатывается только видимое изображение, что снижает нагрузку на потребление ресурсов компьютера, что особо актуально для файлов большого размера и для владельцев слабых машин;
- возможность использования формата для отображения литературы и документов, содержащих формулы, диаграммы, таблицы, а также исторических документов, с сохранением фактуры отсканированного документа;
- текст остается четким даже при сильном увеличении.
- DjVu – это сжатие изображения с потерями. То есть часть информации неизбежно теряется. В основном, это касается картинок.
DjVu сейчас
Изначально этот формат имел открытый код, благодаря чему существует огромное количество бесплатного программного обеспечения для работы с ним. Но в 2000 году компания AT&T Labs передала права на формат компании LizardTech, которая продолжила путь по продвижению и развитию DjVu, при этом уже опираясь на коммерческие рельсы, предлагая свои продукты за деньги.В 2005 году используя технологию DjVu, в электронный вид было переведено более 4000 выпусков журнала The New Yorker за 80 лет его существования. Они уместились на 8 DVD дисках.В последнее время DjVu распространяется по Интернету очень быстрыми темпами. В первую очередь за счет выигрышного размера файла. Но при этом многие пользователи еще не научились в достаточной мере работать с этим типом сжатия. Как следствие – DjVu в большинстве случаев значительно проигрывает PDF.
Серьезным препятствием на пути развития DjVu является и тот факт, что PDF уже на протяжении многих лет используют в различных сферах, и этот формат стал эталоном документооборота. Различные руководства пользователей, документы распространяются в формате PDF. Тем не менее, новая технология прогрессирует и постепенно завоевывает свое место на рынке и в сердцах пользователей Интернета.
И самые свежие новости из мира DjVu от МирСоветов. 1 июля 2008 года компания Celartem Technology Inc., поставщик программных решений для хранения, просмотра и распространения мультимедийных материалов, а также материнская компания, отделением которой является компания LizardTech, анонсировала создание нового центра по продажам и управлению DjVu, который разместился в Сиэтле, штат Вашингтон (США). Соответственно теперь в Интернете поддержка формата осуществляется не с сайта компании LizardTech (http://www. lizardtech. com), а с сайта Celartem Technology Inc. (http://www. celartem. com).
Известный мировой проект создания недорогого компьютера для детей Африки – "One Laptop per Child" – так же избрал для использования формат DjVu, который оптимально отвечает требованиям концепции проекта своими небольшими размерами.
Возможности работы с форматом DjVu
Что же мы можем делать, работая с документом в формате DjVu? Конечно, все зависит от конкретно выбранной программы, но есть какие-то общие особенности.При работе с форматом DjVu можно:
- увеличивать/уменьшать страницы, выставлять по ширине/высоте страницы. Их можно переворачивать, размешать по две или четыре на экране, перелистывать или прокручивать, используя скроллинг;
- работать с текстом, если файл содержит слой с распознанным текстом (OCR). В этом случае текст можно выделять, копировать и вставлять в текстовом редакторе, также в этом случае можно пользоваться поиском по тексту документа;
- выделять отдельные части страницы и копировать в буфер;
- документ или отдельные страницы выводить на печать;
- делать закладки, использовать гиперссылки, что приводит к хорошей навигации по книге;
- просматривать страницу в разных режимах (цветной, черно-белый, задний план, передний план). МирСоветов советует иногда (для лучшего отображения текста) переходить с цветного режима в черно-белый. Текст при этом становится более четким и ярким, но не отображаются цветные картинки.
Программы для просмотра DjVu
Используя какие программы, можно комфортно просмотреть книги, сохраненные в этом формате? Существует множество просмотрщиков, мы кратко опишем преимущества и недостатки некоторых наиболее распространенных и самое главное бесплатных программ.DjVu Browser Plug-in for Windows
Страница программы (англ. ): http://www. celartem. comПросмотрщик от компании LizardTech, которая сейчас продвигает формат DjVu. На странице загрузки можно выбрать либо установку в автоматическом режиме, либо сначала скачать файл, а затем установить программу вручную.
Язык: поддержка 10 языков (русского в этом списке, к сожалению, нет)
Платформа: Windows, Mac OS X, UNIX
Скачать: http://www. celartem. com/en/download/djvu. asp
Размер: 5,6-7,4 Мб (в зависимости от выбранного языка)
Стандартный набор функций. Имеются различные режимы просмотра, зум, вывод на печать и возможность сохранения страниц в формате BMP (например, для дальнейшего использования в программе FineReader). Простой и удобный интерфейс.
Отдельные части страницы можно выделять и копировать как картинку.
При работе с текстовым слоем не очень удобно сделан поиск. Хотя он и обладает рядом настроек и успешно справляется со своими функциями, но не позволяет вывести все найденные результаты в виде ряда закладок. Найденные результаты приходится просматривать по одному. Зато очень хорошо работает выделение текста. В отличие от других представленных в обзоре программ, творение LizardTech копирует текст с наименьшим количеством «мусора» (различных значков, нечитаемых символов), поэтому результат требует меньше затрат на редактировании в текстовом редакторе.
Как и другие программы представленные в обзоре (кроме DjVu FancyViewer) имеет полезную функцию – масштаб по выделению. Выбираем эту команду и выделяем часть страницы – в следующее мгновение она будет увеличена.
Но программа не лишена недостатков. Сильно раздражает отсутствие скроллинга внутри документа (работает только внутри каждой страницы по отдельности), не хватает возможности делать закладки.
WinDjView
Страница программы (рус): http://windjview. sourceforge. net/ru/index. htmlУдобная, красиво сделанная программа, имеет небольшой размер и не требует установки. По умолчанию выставлен английский язык. Чтобы выставить русский, МирСоветов советует сразу же скачать дополнительно библиотеку WinDjView-0. 5-RU. dll со страницы загрузки и поместить ее в одну папку с программой. Затем запустить просмотрщик и выбрать в меню русский язык.
Платформа: Windows 2000/ХР/2003
Язык: английский (русский, если скачать дополнительную библиотеку)
Распространение: бесплатно
Скачать: http://sourceforge. net/project/showfiles. php?group_id=114927
Размер: 0,5 Мб
Есть различные настройки, в том числе по коррекции изображения (яркость, контраст, гамма)
При работе с текстовым слоем (OCR) можно выделять часть текста, копировать, осуществлять удобный поиск, а также экспортировать весь текст в отдельный файл (txt). Можно выделить часть текста (заливкой, рамкой), делать закладки.
Кроме масштабирования по выделению WinDjView имеет еще одну интересную функцию, связанную с режимом увеличения. В этом режиме по нажатию левой кнопки мыши, можно увидеть увеличенное изображения части страницы, будто вы рассматриваете ее под лупой.
Отдельные страницы можно экспортировать в формат BMP.
STDU Viewer
Страница программы (англ. ): http://www. stdutility. com/Еще один просмотрщик DjVu. Во время установки можно выбирать один из двух языков: английский или русский. Быстро работает, имеет небольшой размер. Очень полезная функция – создание закладок и сохранение их в самом документе. А главное преимущество перед остальными рассмотренными программами – поддержка, кроме непосредственно формата DjVu, просмотра TIFF и PDF-документов, благодаря чему STDU Viewer выступает еще и альтернативой Adobe Reader’у.
Платформа: Windows 2000/XP/2003/Vista
Язык: английский и русский
Распространение: бесплатно
Скачать: http://www. stdutility. com/stduviewer. html
Размер: 1,5 Мб
Данная программа обеспечивает наиболее комфортную работу с текстом, естественно, при наличии текстового OCR слоя. Здесь есть возможность выделять фрагмент текста и копировать его в буфер, с последующей вставкой в текстовый файл. Для выделения всего текста в документе достаточно выделить небольшой фрагмент в начале и нажать «End». Очень удобная система поиска, имеющая полезные настройки (учитывать регистр, только слово целиком). Результат поиска выдается в виде списка с закладками: в первой колонке указан номер страницы, во второй – отрезок текста с искомым словом. Двойной клик на любой из закладок переводит на нужную страницу, предложение с искомым словом выделено цветом.
Есть также возможность настройки яркости, контраста и гаммы изображения, опция не очень востребованная, но крайне полезна при просмотре документов не в самом лучшем качестве. При этом минусом является отсутствие возможности отображения отдельных слоев изображения (цветного, черно-белого, переднего и заднего фона).
Мой выбор – именно эта программа. Лучшее сочетание компактности, удобства и функциональности. И естественно – поддержка русского языка!
DjVu FancyViewer
Страница программы: нетПростая и уже устаревшая программа, не требует установки. Ничего особенного, кроме красочно сделанного перелистывания страниц в режиме разворота. Есть несколько их вариантов – ощущение будто перелистываешь настоящую книгу. В этом правда есть и неудобство. Программа отображает книгу все время в развернутом на две странице виде, поэтому, чтобы было удобно читать, приходится постоянно использовать зум.
Платформа: Windows
Язык: английский
Распространение: бесплатно
Скачать: http://djvu-inf. narod. ru/djvubookmark. rar
Размер: 1,5 Мб
Полностью отсутствует возможность работы с текстом, нет вывода на печать. Никаких дополнительных настроек. С другой стороны, программа очень проста и вполне подойдет человеку, который не хочет разбираться в большом количестве настроек и функций, а хочет просто открыть и просмотреть документ или книгу. Так как ничего больше сделать в этой программе не получится.
В целом функциональность утилит не сильно отличается. Поэтому при выборе программы для просмотра книг и документов в формате DjVu стоит обратить внимание на язык интерфейса, необходима ли установка (незачем засорять компьютер и реестр, если есть возможность этого не делать) и на размер установочного файла программы. Хотя все конечно зависит от того, зачем эта программа нужна человеку, и что именно он собрался в ней делать.
Отзывы и комментарии