![]() |
#1 |
Главный Кинооператор
Новичок
|
Создание книги из jpeg файлов
Есть отсканированная книга, при попытке собрать, ничего не выходит. Находил много мануалов, но...руки не с того места. Есть книга и в OCR формате с ошибками, но её запрещают заливать, ибо её делал сам, распознавание текста, нет вычитке. Хотел бы объединить сканы. Кто может помочь?
Вот ссылка на архив отсканированной книги |
![]() |
![]() |
#2 |
Техподдержка
![]() ![]() |
|
![]() |
![]() |
#3 |
ВИП
![]() ![]() |
|
![]() |
![]() |
#4 |
Техподдержка
![]() ![]() |
Если на скорую руку, не выравнивая страницы, можно использовать для получения PDF файла программу PDF24 Creator (русский язык в комплекте, бесплатна).
Минут за 15, получаем такой файл. |
![]() |
![]() |
#5 |
ВИП
![]() ![]() |
А если потратить в два раза больше времени, используя ScanTailor и Adobe Acrobat можно получить вот такой результат https://yadi.sk/d/vHf8CY47hDcDY ) п.с. яндексдиск работает с перебоями |
![]() |
![]() |
#6 |
ВИП
![]() ![]() |
Некоторые страницы, где был темный край, нечитаемы: Можно в ScanTailor выбрать смешанный режим и увеличить жирность текста до 12 пунктов. Проблемные области на первых страницах перевести в режим картинки. |
![]() |
![]() |
#7 |
ВИП
![]() ![]() |
|
![]() |
![]() |
#9 |
Главный Кинооператор
Новичок
|
Книгу я прижимал к стеклу сканира видать слабо давил.
nb92, kolia1984 Спасибо. Возьму вариант nb92. Если нет возражений, то его и залью. Есть и моя личная работа, как писал распознанный текст, но без вычитки, жаль запрещено и вес куда меньше и смотрится лучше, вот |
![]() |
![]() |
#10 |
ВИП
![]() ![]() |
Конечно, такой распознанный, переведенный в текст и великолепно отформатированный материал гораздо лучше любых сканов.
Я не контроллер в разделе Библиотека. Поэтому вопрос дилетанта: а что такое вычитка? Нужно сравнивать текст с исходником? |
![]() |
![]() |
#11 |
Главный Кинооператор
Новичок
|
Проверка на грамматические ошибки. В распознанном тексте они могут появится.
На книжных трекерах такие раздачи разрешены, просто качество указывается OCR с ошибками. Но один из редакторов мне запретил заливать мою версию увы |
![]() |
![]() |
#12 |
ВИП
![]() ![]() |
Так а что мешает текстовый исходник прогнать в том же Ворде, включив Орфографию?
|
![]() |
![]() |
#13 |
Главный Кинооператор
Новичок
|
Текстовика не осталось, можно просто скопировать, но все переделывать выйдет. Например в программе, что бы получить длинное тире нужно написать "--- и это одна из команд. Те же сноски задаются командой footnote{текст}, а так я копировал текст при создании документа и вставлял его сперва в translit.ru и на сайте проверял орфографию, но были слова, которые сайт не знал, а некоторые подчеркивал как ошибки, хотя в книги это слово было написано именно так.
|
![]() |
![]() |
#14 |
ВИП
![]() ![]() |
Само собой, если много японских имен и фамилий или терминов, то он не будет их знать. Поэтому просто сверяете с оригиналом и жмете Пропустить все.
|
![]() |
![]() |
#15 |
Главный Кинооператор
Новичок
|
|
![]() |
![]() |
#16 |
ВИП
![]() ![]() |
Мой вариант, к сожалению, не пойдет. Воспользовался онлайн-конвертером, а он мне последовательность страниц перепутал.
А исходники уже удалил. Сейчас попробую поковыряться с Вашим текстовым вариантом. |
![]() |
![]() |
#17 |
ВИП
![]() ![]() |
Воспользуйтесь утилитой ScanTailor.
Она великолепно работает со сканами, автоматически разбивая на страницы, выравнивая, выставляя поля. Там есть хороший видеоурок на русском. Режим для всех страниц выставьте смешанный, жирность увеличьте до 12. И пройдитесь по всем страницам. Часть, что нечитаема можно пометить как картинку. В отдельной папке после пакетной обработки будут готовые постраничные сканы в tif Их можно конвертировать в pdf |
![]() |
![]() |
#19 |
ВИП
![]() ![]() |
На этапе Вывода, когда просматриваете сканы, на нужной картинке выбираете Зоны картинок и выделяете область, которая нечетко читается (правой клавишей мыши ставятся вершины многоугольника, который и обозначит границы зоны скана, который будет распознан как картинка).
Потом возвращаетесь на вкладку Вывод и видите результат - та часть картинки, которую вы выделите, не будет переводиться в режим черно-белого контрастного изображения, а будет оставлена как цветное изображение. |
![]() |
![]() |
#20 |
Зритель
![]() ![]() |
Доброго времени суток всем! Подскажите, пожалуйста, куда можно обратиться на счёт фонов для электронных книг? Может существуют какие-то программы с этими фонами, которые подойдут для запуска на андроиде? Или здесь кто-то в курсе этого?
|
![]() |