Это исчерпывающая сборка программ для создания, редактирования и чтения DjVu-файлов. С ее помощью ты можешь создать электронную книгу в формате DjVu с OCR-слоем (текстовым слоем) и содержанием.

Основной алгоритм:

1) Scan Tailor Universal - обработка изображений.

2) Book Restorer - выпрямление искривлённых изображений.

3) Tsushima - удаление марашек.

4) DjVu Small Mod 0.7.6.1 - создание DjVu-документа.

5) DjVu Imager - вставка цветных/серых иллюстраций.

6) ABBYY Finereader - создание OCR-слоя.

7) FR11 DjVu Text Layer Crutch - правка и перенос OCR-слоя.

8) Document Express Editor 6.0.1 - добавление обложки.

9) Pdf & DjVu Bookmarker - добавление содержания.

10) DjVu Hyperlinks Editor - добавление гиперссылок.

11) DjVu Annotations Editor - изменение стиля гиперссылок.

12) Document Express Editor 6.0.1 - редактирование гиперссылок.

Функции программ


WinDjView - программа для чтения .djvu файлов.

Alt+Left - вернуться обратно после перехода по гиперссылке.

Ctrl+M - изменить масштаб. Если предустановленные масштабы 150% и 200% не подходят, берём среднее арифметическое - 175%, если не подходит и это, то 162% или 187%. Если нужно чуть больше 150% - накидываем 6%.

При расплывчатом изображении необходимо перейти в Свойства->Совместимость->Изменить параметры высокого DPI->Изменить параметры для всех пользователей->Переопределите режим масштабирования высокого разрешения. Масштабирование выполняется:->Приложение.

https://windjview.sourceforge.io/

IrfanView - программа для конвертирования изображений.

https://www.irfanview.com/64bit.htm

Scan Tailor Universal - программа для обработки изображений.

Настройки:
Инструменты->Настройки…->Общее->Спрашивать каждый раз. Снимаем галочку.
Общее->Лента предпросмотра страниц->Размер кэшированных изображений (макс.): 1000 px
Общее->Методы сжатия Tiff->Метод сжатия TIFF (ч/б): CCIITTFAX4
Макетирование страницы->Поля. Везде 10.
Макетирование страницы->Выравнивание->Автоматическое определение выравнивания. Ставим галочку.
Вывод результатов->Показывать оригинал страницы при нажатом пробеле. Ставим галочку.
Вывод результатов->Смешанный режим->Слой всего контента. Убираем галочку.

Новый проект… Выбираем папку с изображениями. Затем из проекта можно убрать некоторые изображения, например, обложку.

Чтобы увеличить миниатюры изображений, зажимаешь Alt и крутишь колёсико мыши.

Для удобного перемещения по миниатюрам используй клавиши pgup и pgdn.

Ход обработки:

1) Исправление ориентации

Поворот страниц на 90 градусов. Чтобы применить к группе изображений, нажимаем Применить к… Выбираем область действия.

2) Разрезка страниц

Если на изображениях есть кусок другой страницы или на изображениях по две страницы, запускаем. Программа либо обрежет изображение, либо разделит на две. На всякий случай лучше проверить за программой и просмотреть на миниатюрах результат.

3) Компенсация наклона

Исправление наклона текста.

4) Область контента

Программа автоматически находит контент страницы - накидывает на страницу прямоугольник, содержание которого будет взято в итоговую картинку. Опять же, запускаем и затем проверяем за программой. В случае неточности правим в ручную.

5) Макетирование страниц

Если прямоугольник контента маленький, поля можно сделать 5 мм. Если обрабатываешь изображения вместе с обложкой, для обложки нужно сделать нулевые поля и снять галочку с Выровнять размеры с другими страницами.

6) Вывод

Смотрим на результат бинаризации. Если пропадают части букв - ставим Порог бинаризации 20. В крайнем случае - 30. Повышенный Порог бинаризации прибавляет жирность тексту. Если книжка с иллюстрациями, необходимо использовать режим Смешанный. Убираем галочку Слой поиска иллюстраций. Ставим галочку Слой зон иллюстраций. Убираем галочку Выровнять освещение, если иллюстрации теряют детали. Запускаем вывод. Программа автоматически найдёт иллюстрации. После вывода за программой нужно проверить. Просматриваем все изображения с иллюстрациями. Параллельно рассматриваем страницы на наличие пятен, которые можно удалить в разделе Зоны заливки. Если зона иллюстрации нашлась неправильно, нужно подправить. Нужно зайти в раздел Слои. Либо перетаскиваем вершины. Либо удаляем зону и создаём свою. Кликаем правой кнопкой мыши по изображению, зажимаем Ctrl, чтобы зона была прямоугольная, и выводим прямоугольник. Если зона сложной формы, проделываем многоугольник. Зону иллюстраций можно использовать на участке изображения, где текст плохо распознан и при бинаризации детали текста исчезнут. Разделяем текст и иллюстрации. Инструменты->Экспорт изображений…->Экспорт результатов. После обработки изображений сохраните проект.

http://forum.ru-board.com/topic.cgi?forum=5&topic=32945

Book Restorer - программа для выпрямления искривлённых изображений. Создаём Книгу. Если нужно, можно оставить исходные имена файлов: Standart page->Свойства->Нумерация->Оригинальное имя. Выбери все файлы (Ctrl+A). Сервис->Реставрация->Геометрическая коррекция. Publish (иконка диска в меню). Когда распрямляешь чёрно-белые изображения в графе Тип файлов выбираем G4-сжатие, в графе Цветовая гамма - Черно-белая. Проверь результат. Если результат более искажён, чем исходное изображение, замени результат исходным изображением. Когда распрямляешь текст книжки с иллюстрациями, тебе нужно закинуть в программу полученные из Scan Tailor цветные изображения. При выводе в графе Тип файлов выбираем TIFF LZW-сжатие, в графе Цветовая гамма - RGB цвета. Распрямлённые изображения разбиваем на текст и иллюстрации в Scan Tailor.

http://djvu-converter.narod.ru/

Tsushima - программа для удаления марашек. Перетащите изображения на иконку программы. Результат - изображения в формате 8BPP 96DPI. Конвертируйте изображения в формат 1BPP 600DPI в IrfanView.

http://publ.lib.ru/cgi/forum/YaBB.pl?num=1530528723/13#13

DjVu Small Mod 0.7.6.1 - программа для кодирования и декодирования DjVu-документов, то есть для создания DjVu-документа из изображений и извлечения изображений из DjVu-документов. Для чёрно-белых изображений используем следующий профиль кодирования:

Набор: Оригинальные

Тип: Черно-белый

dpi: 600

https://book-scan.wixsite.com/djvu/blank-z8lfg

DjVu Imager - программа для вставки иллюстраций. Указываем путь к DjVu-документу с вырезанными иллюстрациями и путь выходного файла. Указываем путь к папке out/export/pic. Нажимаем Пуск. Далее нажимаем вставить в DjVu. Получаем DjVu-документ с иллюстрациями. Настройки: ДЗФ - 2, DPI - 300.

http://www.djvu-soft.narod.ru/scan/djvu_imager_en.htm

FSD - аналог DjVu Small Mod + DjVu Imager.

http://www.djvu-soft.narod.ru/soft/

https://www.youtube.com/watch?v=jOQBTV-zvts

DjVu Small Mod + DjVu Imager и FSD реализуют метод разделённых сканов. Изображения разбиваются на текст и иллюстрации, которые кодируются отдельно.

Document Express Editor 6.0.1 - программа для удаления/вставки изображений в DjVu-документ, используется при вставке обложки. Если появляется полоса в развёрнутом виде, используйте те же настройки совместимости, что и для WinDjView.

http://www.djvu-soft.narod.ru/soft/

ABBYY Finereader - программа, накладывающая OCR-слой на DjVu-документ, может быть использована для извлечения из PDF-документа изображений в формате TIF. В настройках ставишь галочку Без предобработки, чтобы при извлечении OCR-слоя текст лег на своё место. Обязательно использование Тщательного распознавания. При распознавании литературы на русском языке выбираем язык распознавания Русский и английский. Так как в выходном DjVu-документе нужен только текстовый слой, для ускорения вывода DjVu-документа можно изменить настройки экспорта DjVu на максимальное сжатие.

https://btdig.com/db98398f6d1c9bbd4c8ac905dc30abb5f9e4b704/abbyy-finereader-kpojiuk

FR11 DjVu Text Layer Crutch - программа для исправления OCR-слоя из созданного программой Finereader DjVu-документа и вставки в исходный DjVu-документ (в выходном DjVu-документе Finereader цветные/серые иллюстрации теряют в качестве).

https://forum.ru-board.com/topic.cgi?forum=5&topic=38467

DjVu Clean Page Inserter - программа для вставки пустых страниц в DjVu-документ.

https://forum.ru-board.com/topic.cgi?forum=5&topic=38467

Pdf & DjVu Bookmarker - программа для добавления содержания. Копируем текст содержания. Вставляем в программу. Редактируем. Есть возможность расположения закладок в виде иерархической структуры. Вставляем в DjVu-документ. Советую обратить внимание на клавиши F2 и F3, в значительной мере ускоряющие работу над содержанием.

https://sourceforge.net/projects/djvubookmarker/

DjVu Hyperlinks Editor - программа для автоматического создания гиперссылок. Для работы программы необходим OCR-слой. Как смещение указываем на сколько номер страницы DjVu-документа больше номера страницы книги. Затем указываем страницы документа у содержания / алфавитного указателя. Выбираем Тип работы Содержание / Алфавитный указатель 2. Создадутся ‘гиперссылки, видимые при наведении курсора на содержание’ / ‘гиперссылки в алфавитном указателе’.

http://www.djvu-soft.narod.ru/soft/

DjVu Annotations Editor - программа для изменения свойств гиперссылок. Переходим в Свойства гиперссылок. Выбираем Отображать постоянно (если изменяем гиперссылки алфавитного указателя), отключаем заливку и стираем комментарий. Применить. Сохранить. Открываем DjVu-документ в программе Document Express Editor 6.0.1 и удаляем гиперссылки на номерах страниц - Annotation->Delete. Для ручного удаления/добавления гиперссылок содержания необходимо нажать в меню Select Annotations - гиперссылки содержания станет видно. Далее, например, можно исправить края гиперссылки, перекрывшей несколько пунктов содержания и создать недостающую гиперссылку, нажав в меню Rectangular Hyperlink и выделив пункт содержания. В графе Style выбираем Plain Border, Persistent, в графе Link - Page Number, а графе Page – страницу документа.

https://forum.ru-board.com/topic.cgi?forum=5&topic=38467

DjVu Chunk Remover - программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.

https://forum.ru-board.com/topic.cgi?forum=5&topic=38467

Архив с программами на случай, если ссылки сломаются - https://disk.yandex.ru/d/odtW8TX4diIVsg

Где опубликовать книгу:

Library Genesis - https://library.bz/main/upload/
genesis
upload

Z-Library - https://singlelogin.re/book-add

RuTracker - https://rutracker.org/forum/index.php

VK - https://vk.com/docs

Информация:

http://www.djvu-soft.narod.ru/

http://publ.lib.ru/cgi/forum/YaBB.pl