Главная - e-Book Info - Форматы е-книг

Продолжение обзора Форматы е-книг


Самыми удобными для применения в качестве электронных книг e-book'ов, самыми распространенными в этом смысле и видимо самыми перспективными являются форматы, входящие в группу автономных форматов. Собственно, эти форматы заслужили полное право считаться «е-книжными».

PDF Portable Document Format pdf *.PDF (Portable Document Format) - это переносимый платформонезависимый портативный формат электронных документов, разработки компании Adobe Systems. Кроссплатформенность формата создает прекрасные условия для организации электронного оборота документов, к которому можно причислить и е-книжный. Данные могуть быть импортированы из большинства современных форматов текстовых документов, а также векторных и растровых графических форматов. Проще говоря, документ в формате pdf может содержать шрифты, графику, мультимедийные элементы, и гарантировать их правильное отображение вне зависимости от операционной системы, программного обеспечения, а также пользовательских настроек конкретного компьютера. Именно данное свойство - сохранять исходный вид и сделало его привлекательным для применения в качестве е-книг. Для просмотра PDF-файла не требуется ничего, кроме самого файла и любой программы, умеющей отображать данный формат, к примеру, бесплатной программы Acrobat Reader или другой подобной. Как пример, можете попознакомиться с PDF-XChange Viewer, или STDU Viewer. Этот формат отличает весьма удобная навигация, которая быстро позволяет найти нужную страницу, а также простота пользования. Может быть использовано шифрование файла для коммерческого использования. При том, что у PDF-формата множество достоинств, не лишен он также и недостатков: даже при заметном сокращении объема, файлы PDF выходят невероятно громоздкими, к тому же, защита, которая применяется для кодирования файла, если не применить специальных для этого программ – знающий программист преодолеет за несколько секунд. Однако, не взирая ни на что, именно данный формат используется для распространения огромного количества технической документации и не только. За рубежом большинство коммерческих изданий издается в этом формате. Ведущее место среди публикаций в PDF-формате занимает всем известный Adobe Acrobat. Но имеют применение также такие программы, как Foxit Reader, eXPert PDF Reader, PDF Reader (не поддерживает русские кодировки) и некоторые другие менее известные программы, среди которых есть и вышеуказанные PDF-XChange Viewer и STDU Viewer.

exe exe *.Exe. По прежнему большой популярностью при создании е-книг используется формат самоисполняемых файлов с расширением *.exe. Это означает, что для чтения книги в этом формате не нужно использовать специальных программ. Этим он удобен для пользователей ПК c ОС Windows, хотя, для других систем совершенно не пригоден. Наверное - это его основная слабость. Некоторые пользователи опасаются скачивать и применять у себя на компьютере е-книги, созданные в этом формате. Основным аргументом является то, что такая е-книга может нести в себе вирус. Это опасение базируется на том, что е-книга в формате exe является по сути самоисполняемой программой, а программы, как известно, подвержены завирусованию. Но ведь и так абсолютный отказ от программ в своем компьютере делает этот компьютер бесполезной кучей железок, так что применять их все равно приходится. Почему бы не применять и е-книги? Думается, слухи о зловредности е-книг в экзешниках сильно преувеличены. Ведь, достаточно проверить файлы е-книг перед применением в своем компьютере антивирусом, и вопрос снимется.
Электронная книга в ехе-формате легко и просто распечатывается на принтере, при условии что данная функция будет включена при компилировании данной электронной книги. Также без каких-либо проблем е-книгу в этом формате может быть защищена паролем, или защищена от копирования в буфер обмена текстовой информации и т.п. В некоторых электронных книгах в ехе-формате поддерживатся функция ребрендинга, т.е. возможности вносить в уже скомпилированную электронную книгу собственную пользовательскую информацию в виде рекламного объявления, сообщения и т.п. Среди недостатков назовем увеличение объема примерно на 200-400 кб за счет компиляции в ехе-файл встроенного браузера для просмотра электронной книги на пользовательском компьютере, вышеуказанная зависимость от ОС Windows и вирусопоражаемость. Хотя, если вирусы попали в ваш компьютер совершенно не обязательно, что первой жертвой станут именно е-книги.
Из чего собственно состоит файл *.exe. Первой составляющей файла является управляющая информация для загрузчика и загрузочного модуля. Информация для загрузчика располагается в начале файла и создает так называемый заголовок. Сразу после него следует вторая составляющая - тело загрузочного модуля, которое начинается на границе блока и образует копию образа памяти задачи, построенной компоновщиком. Е-Книга, созданная в таком формате может содержать текст, рисунки, анимацию, навигационный гипертекст, поиск, живые ссылки на вебстороны, Java апплеты и Java скрипты, что конечно же увеличивает ее демонстрационные возможности. В качестве исходников большинство программ применяют HTML, GIF, JPEG и стандартные плагины. Важной опцией, имеющейся в такой е-книге, является возможность применения парольной защиты, как для всей е-книги, так и для отдельных ее страниц, запрет на печать и копирование, что позволяет активно использовать этот формат при коммерческом распространении. Конечно, вышеназванное ограничение, а именно: е-книги в формате Exe работоспособны исключительно на WINDOWS-платформе, действительно тормозит распространение формата. Однако, возможность легкогоь и быстрого изготовления макета, позволяет делать е-книги не только профессиональным издателям, но и самиздату. Самоисполняемость файла обеспечивает работу без дополнительного программного обеспечения. Внешний вид книги может быть максимально приближен к типографской форме и потому создавать довольно комфортное ощущение, подобное до чтения обычной книги. А учитывая тот факт, что компьютеров на базе ОС Windows никак не убывает, данный формат еще долгое время будет востребован.

exebook exebook *.ExeBook. По сути, он относится к формату Exe, имеется множество родственных опций и функций, главной из которых - его самоисполняемость. То есть, это тоже программа на для применения в ОС Windows. Однако, эту программу (е-книгу) можно назвать особым форматом, которую специально для книгоиздания разработал Яков Судейкин. В нем весьма реалистично реализован визуальный эффект «живой» книги, что дает пользователю возможность комфортного чтения. На наш взгляд неплохо сделана и защита для коммерческого распространения е-книги. Не все в этом формате реализовано с блеском. Впрочем, разработчик на это пошел сознательно, пытаясь упростить сам процесс создания е-книги. Среди недостатков, ограниченные оформительские возможности, специфические возможности форматирования текста и некоторые шрифтовые ограничения. Это проблемы, которые частично портят кровь издателю, к счастью, только частично, потому что плюсов при создании е-книг в этом формате вполне достаточно, чтобы забыть про недостатки. А пользователям, если они используют в своих компьютерах ОС Windows, лучшего формата для е-книги не найти.

djvu djvu Формат *.DjVu (дежа-вю от фран. deja vu — уже виденное) - это особый формат. Совершенно справедливо его называют «тексто-графическим» форматом, потому что в нем реализуется технология сжатия изображений, которая создана специально для распространения сканированных электронных документов - книг, чаще всего математических, журналов и прочих. Впрочем, ассортимент издаваемых книг вышеперечисленным не ограничивается – ведь можно отсканировать и сжать в этом формате любую книгу. Особенностью формата является то, что он оптимизирован для передачи файла через сеть таким образом, что страницу можно просматривать даже до завершения скачивания. В DjVu-файле может содержаться текстовый (OCR) слой, что помогает в осуществлении полнотекстового поиска по файлу. Кроме того, в DjVu-файле может содержаться встроенное интерактивное оглавление и даже активные области - гиперссылки, в следствии чего может быть реализована удобная навигация в DjVu книгах. Файл отсканированной книги обычно «весит» где-то в пределах нескольких мегабайт, что вполне допустимо. DjVu обеспечивает файлам с черно-белыми монохромными изображениями сжатие порядка 500:1. Это дает выигрыш в размере по сравнению с файлом в формате GIF примерно в 20 раз. Суть технологии DjVu - в автоматической разбивке изображения на несколько блоков (к примеру, текст, логотип фирмы и растровая фотография), для каждого из которых настравивается оптимальный для каждого графического образа алгоритм сжатия. Нет проблем также с чтением таких книг, ввиду имеющихся многочисленных бесплатных и весьма удобных программ. Кстати, в упомянутой нами программе STDU Viewer можно читать, как pdf-файлы, так и файлы djvu. Можете также познакомиться и со специальными программами DjVuSolo и WinDjView-0.5.

chm Compiled html chm С форматом *.CHM (Compiled HTML) вероятно приходилось сталкиваться тем, кто использовал какие-либо Windows-программы. Ведь изначально этот формат создавался для формирования простой, удобной и вместе с тем функциональной справочной системы именно для программ Windows. Однако, сейчас его частенько используют не только для создания хелп-систем к ПО, но также для создания книг в электронном виде. Наиболее сильной стороной рассматриваемого формата, пожалуй, является наличие в файлах CHM полнотекстового поиска. Если представлять файл CHM вкратце - он представляет из себя набор скомпилированных HTML-файлов, своеобразный архив из Web-страниц. И действует CHM-файл также согласно принципа архива, сжимает данные, в нем хранящиеся, правда, не все, а только текстовые или те, что содержат текст, отформатированный при помощи тегов HTML (HTML, TXT, CSS и файлы других форматов). В принципе, процесс создания е-книги в этом формате подобен процессу создания е-книги в формате Exe со всеми его достоинствами и недостатками.

xps xml paper specification xps Формат *.XPS (XML Paper Specification) - это фиксированный формат документа, означающий, что расположение линий и страниц внутри документа фиксировано. В документе в этом формате могут содержаться метки, а также информация, необходимая для его печати. Формат XPS разрабатывался в качестве замены формату Enhanced Metafile (.EMF). Файл формата XPS напоминает pdf-файл, но основан он на XML(напомним, что pdf базируется на языке PostScript). Файл XPS может быть открыт программой Microsoft XPS Viewer (в Windows Vista), а также программой XPS Essentials Pack (для Windows XP). По утверждению многих экспертов этот формат идеальное средство хранения, отображения и публикации данных WPF (Windows Presentation Foundation) приложений. Целью применения XPS является то же самое, что и PDF: отображение документа именно в том виде, в каком он создавался, независимо от установленного на компьютере ПО. Формату не требуется дополнительных компонентов системы, например, наличия определенных шрифтов, и в то же время он гарантиррует разработчику то, что документы будут отображены у клиента так, как запланировано, и в дополнение ко всему, копирование либо изменение данных клиентом уже невозможно.

И напоследок - описание многочисленной группы специальных форматов, которые создавались для корректной работы конкретных программ и оборудования.

lit LIT *.LIT. Формат от Microsoft, основанный на OEB, который долгое время был закрытым форматом. Он в основном читался при помощи официального ПО (Microsoft Reader), что накладывало ограничение на его распространение, однако сейчас эта проблема уже не актуальна. Индексации не поддается. Включает в себя ряд инструментов, которые делают его подобным на Adobe PDF: к примеру, отметим доступность закладок, аннотаций и масштабирования. Степень сжатия текста в пределах 50-60%. По сути, независимым форматом рассматриваемый формат назвать нельзя, скорее он относится к DRM (Digital Right Management - технологии защиты авторских прав в цифровом пространстве) и представляет из себя контейнер для обычных OEB-документов (ZIP-архив xhtml- (xml-), графических файлов а также файла с данными о документе в целом).

iSilo Palm Os Platform iSilo *.iSilo (Pаlm Os Platform /pdb - Palm Pilot Database format) - довольно популярный формат базы данных, применяемый в карманных устройствах. Применяется во всех 3Com PalmPilot, IBM Workpad и Macintosh/PC для сохранения записей в базе данных. Одним из главных достоинств формата является высокая степень сжатия текста из-за чего объем е-книги значительно уменьшается, что очень важно для пользователей КПК. В формате поддерживается множество шрифтов, он умеет корректно работать с графикой, и дает возможность вставлять в книги гиперссылки. Размер одной записи может превышать 64кб, имеются биты BackUp и т.д. Через вьювер от iSilo книги в формате PDB выглядят подобными формату CHM. Других особых достоинств у этого формата не замечается, однако можно получить после компиляции в PDB весьма интересные книги.

pdb palmdoc pdb *.PalmDOC (по-другому - PDB и AportisDoc). Другой не менее популярный Palm-формат. Нормально воспринимаем большинством программ для чтения электронных книг. Однако степень сжатия этого формата гораздо ниже, чем это имеется у iSilo.PDB, исходный текст может преобразовываться либо вовсе без компрессии, либо сжат до 70-80 %, а графика при этом совершенно не поддерживается. Степень компрессии можно несколько улучшить за счет увеличения стандартного 4х килобайтного размера блока документа (document block size).

fb2 fictionbook fb2 *.FB2. (FictionBook 2.0) - является открытым форматом представления электронных версий книг в виде XML-документов, где каждый элемент книги описан своими тегами, что (чисто теоретически) дает возможность создавать программы для чтения на любой платформе и вместе с тем обеспечивать совместимость с любыми устройствами и форматами. Применяя XML можно легко создать документы, которые готовы к непосредственному использованию и программной обработке (конвертации, управлению, хранению) практически в любой среде. Обычно в имеющих расширение .fb2, документах, может содержаться структурная разметка основных элементов текста, определенное количество информации о книге, и вложения с двоичными файлами, в которые могут содержать иллюстрации или обложку. Поддержка Unicode может совершенно снять проблему корректного отображения текста на различных языках. Поддерживает графику. Следует сказать, что для Windows и Pocket PC выпущено достаточное количество инструментов для чтения книг в данном формате, а также для конвертации в него текстов из других форматов. В сети существуют библиотеки, которые поддерживают FB2, а также экспорт из него в другие форматы. При этом пока что неизвестно об имеющихся читалках FB2 под другие платформы.

RB rb *.RB. Разрабатывался специально для устройств для чтения электронных книг Rocket Book и сейчас имеет применение среди его последователей REB 1100, 1200, 1150, 1250, Gemstar и т.п. Однако, в настоящее время формат постепенно умирает, но все, кто по-прежнему пользуется вышеназванными моделями может конвертировать в этот формат при помощи программы Book Designer 4.

zTXT ztxt *.zTXT. - закрытый формат, довольно похожий на PalmDOC, однако, с гораздо более высокой степенью компрессии (до 45%). Допускает возможность вставки закладок, а также поддерживает гиперссылки. Доступен на Palm OS.

TR ToRaTRPW tr *.TR (ToRaTRPW). - формат программы-читалки Tome Raider, который отличает одна из наиболее высоких степеней сжатия. А благодаря возможности индексации текста данный формат можно использовать при составлении каталогов электронных книг. На самом деле, формат TR-текстов это, прежде всего, успешный синтез простых баз данных и гипертекста. Соответственно, в нем могут совершенно просто читаться мощные мегабайтные тексты с заголовками, которые выводятся в режиме перечня (содержания). Данный формат более комфортен для работы с электронными словорями, тезарусами, справочниками, учебниками, энциклопедиями и иными реферативными материалами. Текст разбивается на законченные в смысловом отношении части (темы, странички, блоки), любая из которых имеет свой собственный заголовок.

DataPlkr DataPlkr *.DataPlkr. - открытый формат Plucker — специальной программы, которая предназначена для просмотра веб-документов на Palm. Корректно отображает рисунки, гиперссылки, и разные шрифты. А для конвертирования в этот формат даже не нужно запускать внешние приложения — после установки соответствующего ПО его можно делать при помощи контекстного меню.

fbr fbr *.FBR. - в данном случае имеется ввиду защищенный формат данных, доступных для чтения программой Franklin Reader. Возможно, у кого-то еще сохранился данный девайс.

prc prc *.PRC. Сжатый формат PRC – который относится к Palm-форматам, в своей работе использует механизм шифрования контента е-книги, что обеспечивает при ее продаже надежную защиту. Файлы с расширением PRC используются у электронных книг в формате Mobipocket Reader для их чтения на кпк и телефонах.

rbc rbs *.RBS (Radix-Tools REBUS) - защищенный формат, который основан на HTML и включает в себя текстовый, графический, мультимедиа-контент, а также интерактивные составляющие. Использование в данном формате HTML-языка дает возможность при помощи специального ПО легко производить конвертирование файлов практически любого формата в RBS-вид. В электронном виде в формате RBS представлено множество типов бумажных изданий, таких, как учебные и контрольные тесты, анкеты – результаты опросов, картографические документы, справочники, энциклопедические материалы а также художественная литература. Применяется в системе электронных публикаций, информационно-поисковой и аналитической системе REBUS.

Наверное можно еще долго перечислять здесь не один десяток форматов. Однако, скорее всего, это будет интересно только опытным специалистам, либо обладателям диковинных аппаратов или программ, не так распространенных, чтобы их рассматривать в этом обзоре. Однако, если кто-нибудь выразит интерес к какому-либо формату, можете обратиться, добавим сюда интересующее вас описание.

Владимир Филиппов Parroslab Group

<< К началу обзора