Проблема конвертации PDF

Forums: 

Проблема заключается в том, что при сохранении некоторых пдф книг в ТХТ файл (к примеру средствами того же адоби ридера) каждая строка начинается с новой строчки :))). Т.е. напиханы символы возврат каретки и новая строка (так что ли называется? \r\n короче). Как будто это стихи... Ну и в общем на КПК это безобразие читать потом очень неприятно. Может кто-то с этим сталкивался и успешно решил эту незадачу? ;)

попробуй его загнать сначала в html, а уже потом в fb2

BD и FBD в помощь. OCRpad тоже хорош.

Всем спасибо! Разобрался маленько :) Только вот OCRpad найти не удалось - все ссылки битые.

Цитата:
Только вот OCRpad найти не удалось

Умеешь торрентами пользоваться? Если умеешь, вот:
http://thepiratebay.org/tor/4073583/Book_Processing_Soft_%5BScanning__Scan_Conversion_Processing__OCR_
- ссылка на соответствующий софт (там гигабайт 7, выбирай, что хошь)

Да просто я не очень люблю всякие там торренты и проч. :) Но в отсутствии альтернативы пришлось заюзать твою ссылку. Спс

Могу прислать/выложить более полные скрипты для OCR pad. Те, что в комплекте - далеко не все случаи обрабатывают.

Линк на саму прогу OCR pad и описание: (http://www.the-ebook.org/rus/?p=250)

Ну если не очень сложно, то конечно выложи куда-нить: полюбопытствую, да может еще кому-нибудь будет полезно :)

Распаковать, положить в папку "Bookcleaner что-то там" где установлена сама прога ocr pad.
http://www.savefile.com/files/1601114

при запуске Bookcleaner-а (иконка-веник) выбрать этот файлик, нажать реплэйс ол и вперед.
При необходимости - редактирвать этот файл, или создать новый, добавляя свои варианты замен.

Распаковать, положить в папку "Bookcleaner что-то там" где установлена сама прога ocr pad.
http://www.savefile.com/files/1601114

при запуске Bookcleaner-а (иконка-веник) выбрать этот файлик, нажать реплэйс ол и вперед.
При необходимости - редактирвать этот файл, или создать новый, добавляя свои варианты замен.

X