Есть 4 основных формата электронных книг:

DjVu

PDF

FB2, EPUB

DjVu-файл - это скан.

PDF-файл - это скан или макет.

FB2-файл - это XML-файл (текстовый файл с форматированием) с описанием и картинками в формате Base64.

EPUB-файл - это сжатые HTML-файлы с описанием, стилями, картинками и шрифтами.

Итак, DjVu и PDF - форматы сканов. FB2 и EPUB - текстовые форматы.

Эти форматы возникают при оцифровке книг. Если ты обрабатываешь и кодируешь сканы, ты получаешь DjVu или PDF. Если ты распознаешь текст со сканов, ты получаешь FB2.