Вы здесьМуки с Word`ом
Опубликовано чт, 05/02/2009 - 06:19 пользователем sc_pasechnik
Доброго времени суток. Кто может подсказать хорошее средство для "причесывания файла" после сканирования на предмет мусора. Делаю вычитку в Word`е и в fb2 перегонять пока не буду (хотя если кому интересно книга С.Р. Певзнер "Вождение автомобиля" Москва, 1972 г.)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
babajga RE:Нержавеющая сабля 6 часов
sem14 RE:«Уроки русского» 9 часов Aliki RE:Подайте бедному копеечку на книжку с литреса... 19 часов Isais RE:Древний Рим. Подборка книг 1 день kopak RE:О группе Дятлова. О той самой, того самого... 2 дня edvud RE:Прошу переформатировать, распознать, etc... 2 дня babajga RE:Отчаянная осень 3 дня babajga RE:Сказки Сени Малины 3 дня babajga RE:Сказки 3 дня babajga RE:Мои четвероногие друзья 3 дня Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 дня Isais RE:Семейственность в литературе 1 неделя kopak RE:Таинственная личность админа Флибусты 1 неделя babajga RE:Ласси возвращается домой 1 неделя sem14 RE:Подборка о Первой Мировой 2 недели Isais RE:удаление "двойников" 2 недели Isais RE:Кармен Мола - Пурпурная сеть [litres] 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 3 недели Впечатления о книгах
nik_ol про Донцова: Кружок экстремального вязания [litres] (Иронический детектив, Детективы: прочее)
28 02 Спасибо, что выложили новое!) Оценка: хорошо
gruin про Валин: Штурмуя Лапуту (Боевая фантастика, Героическая фантастика, Самиздат, сетевая литература)
28 02 Повествование окончательно стало бессвязным и немотивированным. Даже рояли кончились. Оценка: нечитаемо
Stager про Валин: Штурмуя Лапуту (Боевая фантастика, Героическая фантастика, Самиздат, сетевая литература)
26 02 Повествование окончательно стало бессвязным и немотивированным. Даже рояли кончились. Но забавно, местами увлекательно. Оценка: неплохо
Lan2292 про Nooby: Торговец (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
26 02 чЕЛОВЕК ПИСАЛ, ТРАТИЛ ВРЕМЯ, НО К СОЖАЛЕНИЮ НА ВЫХОДЕ ПОЛУЧИЛАСЬ ХРЕНЬ, А Я ЧЕСТНО ПЫТАЛАСЬ ПРОРВАТЬСЯ ЧЕРЕЗ СТРОЧКИ, НО УВЫ И АХ. Оценка: плохо
iggy71 про Маканин: Валечка Чекина (Современная проза)
25 02 Писатель намеревался, видимо, создать загадочный образ провинциалки, "в которой что-то есть", и типа все хотят с ней познакомиться поближе, и она такая себе любвеобильная, духовная и проч. Автор ей симпатизирует, но вот образ ……… Оценка: плохо
konst1 про Рубина: Окна [Авторский сборник] (Современная проза)
25 02 Вдруг Борис заметил: – Между прочим, знаешь ли ты, что еще совсем недавно, в XVIII веке, жители Корнуолла промышляли таким вот способом: в особо сильный шторм выносили на берег большие фонари и расставляли рядами там, ……… Оценка: отлично!
Дей про Господин следователь
25 02 Очень интересно. Детективная и, скажем так, бытовая линии отличные, любовная же не понравилась. Влюбился с первого взгляда, лучше её нет (это ещё даже не разговаривал с ней ни разу), вот эти китайские церемонии с ухаживаниями ………
Олег Макаров. про Капба: Как приручить дракона - 4 [СИ] (Альтернативная история, Киберпанк, Фэнтези, Попаданцы, Самиздат, сетевая литература)
24 02 Капба прекрасен как всегда. Четвёртый том не хуже (лучше!) предыдущих, хотя казалось бы куда ещё. Очень отличная книга. Оценка: отлично!
obivatel про Калинин: Вторая Отечественная [litres] (Альтернативная история, Боевая фантастика, Попаданцы)
24 02 Автор датэл: "если именно благодаря революционерам Россия потеряла шанс выйти из нее в качестве главного победителя". . Если пишешь что-то о периоде, не поленись узнать как оно было. Царя опрокинули крупнейшие промышленники ……… Оценка: плохо
mysevra про Себастьянович: Новая книга о сыроедении, или Почему коровы хищники (Здоровье)
24 02 Подход для таких ленивых как я - нет обязательных самостоятельных чисток. «Мягким тканям потребуется не менее 2 лет, а скелету - около 7.» Непонятно, есть ли это время. Оценка: отлично!
mysevra про Артюшкина: Голем [litres] (Детективная фантастика, Социальная фантастика, Научная фантастика)
24 02 Такой замечательный мир, отличный язык, но невыносимо неспешное развитие событий – кажется вот-вот случится что-то значимое, а нет, очередной проходной момент. Оценка: неплохо
Isais про Абдуллаев: Заговор в начале эры (Исторический детектив, Политический детектив)
24 02 Скучно, нудно, нехудожественно. Вместо живых картин -- картонные декорации, никто из персонажей не вызывает эмоций -- ни любви, ни ненависти, каждый абзац сопровождается таким же по размеру морализаторским поучением, высказанным ……… Оценка: плохо |
Комментарии
Отв: Муки с Word`ом
Если после сканирования сохранить текст не в ворде, а как текст, весь мусор сам собой исчезает.
После этого текст можно открыть тем же вордом, но в нем уже не будет ни левой графики (в т.ч. крокозябры на сгибах и в развороте), ни разделителей разделов и колонок!
Правда, текстовая разметка (курсив, жирный) тоже теряется.
Восстановление текстовой разметки же занимает существенно меньше времени и требует значительно меньше усилий и нервов.
Отв: Муки с Word`ом
Все бы ничего, но в тексте довольно большой объем занимают картинки и отдельная их вставка в документ будет несколько затруднительна. Думал, может макрос какой есть для чистки.
Отв: Муки с Word`ом
Есть макрос, как не быть - сам себе его писал, много его пользую.
http://www.the-ebook.org/rus/?page_id=122&dl_page=2
http://www.the-ebook.org/rus/?p=255
Text_Cleaner_Macros
Размер файла: 21.0 KiB
Общее количество загрузок: 1,984 Дата обновления: 12 Июнь 2008
Макрос для MSWord (офис 97, 2003) по очистке и приведению в чувство текстов и страниц, скопированных из инета, отсканированных и прошедших обработку OCR pad. Приводит в достаточно красивый вид подавляющее большинство текстов. Подробнее:
.....
Но некоторые мусорные знаки мне проще регулярными выражениями потом именно в фб2 (в ФБЕ) искать.
мусорные знаки после скана (поиском, прямо как есть в квадратных скобках):
[/\\*>|'<_×`]
(включаем галку "Регулярное выражение")
и еще частые случаи
\s- (любой пробел+дефис)
-\s (дефис+любой пробел)
(включаем галку "Регулярное выражение")
И поскольку в фб2 можно перевести достаточно быстро, и он прекрасно открывается и правится вордом (для вычитки), то может имеет смысл все же сразу сделать фб2.
Отв: Муки с Word`ом
За макрос громадное спасибо. Сделаю и ФБ2 толькосначала всетаки вордовский.
Отв: Муки с Word`ом
Eсть знатная программа, убирающая большинство мусора - AfterScan (в варианте Lite - бесплатная, Pro и Express - shareware, но таблетки к ней также имеются). Попробуйте:
http://www.softoman.ru/windows/buisiness/other/11829.html
http://www.panvasoft.com/rus/15/
Отв: Муки с Word`ом
Всегда пользовался средством "Найти и заменить" :)
Хорошо помогает.
Например убрать двойные (многократные) пробелы, лишние переводы строки и абзацы, переносы...
И кодить ничего не надо)
Отв: Муки с Word`ом
После десятка текстов ручная работа по чистке типичных вещей через поиск начинает сильно утомлять ))
Нехай железный конь работает, он для того и нужен.
А пробелы, перевод строк и проч фбд сам исправляет, это вообще в 99% случаев нафиг не надо для фб2 делать.