Внимание! При экспорте из FineReader 11 в fb2 возможно потеря текста!!!!
Опубликовано ср, 23/05/2012 - 00:23 пользователем Belomor.canal
Forums: Привет всем! 3 апреля. СубботаФР -11 интерпретировал как СНОСКУ! При экспорте в fb2, все сноски, которые ФР-11 не знает куда отнести в итоговый текст не попадают! В данном случае текст этой записи пропал! Смена стиля ничего не дала!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 1 день
weis RE:Прошу переформатировать, распознать, etc... 1 неделя larin RE:Заплатила, а абонемента нет и скачать ничего не могу! 2 недели sibkron RE:Серия "Библиотека французской литературы" (Макбел) 3 недели akorish RE:Регистрация 1 месяц Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 месяц Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 месяц konst1 RE:Ух, как я не люблю спамеров! 1 месяц tvv RE:DNS 2 месяца sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 2 месяца larin RE:Заблокирован 2 месяца konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 месяца Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 3 месяца fixel RE:Пропал абонемент 3 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 3 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 4 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 4 месяца Впечатления о книгах
Civilizator про Земляной: Сорок третий (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
19 06 2lorealke: Может Великий Писатель поделится своими Произведениями. Мы сравним... По книге и серии (читаю 7-ю): Отличная серия. Вообще у Земляного плохих книг не попадалось. Даже самые ранние (Обратил на него внимание ещё ……… Оценка: отлично!
lee321 про Прозоров: Темный Лорд: Темный Лорд. Темное пророчество. Меч Эриджуна. Озерная леди. Клятва Темного Лорда [сборник litres] (Героическая фантастика, Фэнтези)
19 06 Читал давно (сразу после опубликования) и тогда понравилось. Написано в "эпоху Гарри Поттера". Немного похоже (тайное паралельное магическое общество, магическая школа, Темный лорд). Вполне оригинальная и интересная история. Оценка: хорошо
gruin про Баренберг: Сага ледяного оазиса [СИ] (Боевая фантастика, Фэнтези, Самиздат, сетевая литература)
19 06 Вполне на уровне. Одобряю. Хотелось бы продолжения Оценка: хорошо
gruin про Прозоров: Темный Лорд: Темный Лорд. Темное пророчество. Меч Эриджуна. Озерная леди. Клятва Темного Лорда [сборник litres] (Героическая фантастика, Фэнтези)
19 06 Написнао много, и всё - дрянь Оценка: нечитаемо
Oleg68 про Кобен: Незнакомец [The Stranger ru] (Детективы: прочее)
19 06 Отличная книга. Сюжет держит до конца в напряжении. Автор, как всегда, на высоте. Оценка: отлично!
Isais про Говоров: Алкамен — театральный мальчик (Историческая проза, Детские приключения)
17 06 До сих пор помню, как я был шокирован в пятом классе, прочитав эту книгу как внеклассное чтение по истории древнего мира. Все было не так — положительные герои не должны исчезать бесследно. Спустя полвека решил перечитать. ……… Оценка: отлично!
Isais про Мун: Меч наемника [Sheepfarmer's Daughter ru] (Героическая фантастика, Фэнтези)
17 06 Производственный роман о карьере наемного солдата (солдатки) в средневековом фэнтезийном сеттинге. Подробно, основательно, без досужих выдумок. Главная фантастика в книге — вежливость, корректность и справедливость, с которой ……… Оценка: плохо
Nicout про Вадим Владимирович Чинцов
17 06 Господи, пусть афтар убьет сибя апстену! Другого способа остановить поток этого говна, похоже, не существует. Этот Чинцов - абсолютный, законченный, и патентованный бездарь с суконным языком, который не имеет понятия о художественной ………
lorealke про Земляной: Сорок третий (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
16 06 Плоская картонка. Видимо, чукча не читатель. Да и писатель не очень... Оценка: плохо
decim про Слоун: Круглосуточный книжный мистера Пенумбры [litres] [Mr Penumbra's 24 Hour Bookstore ru] (Детективная фантастика, Фэнтези, Городское фэнтези)
16 06 Зазывной блёрб привирает: этой книге очень далеко до Мураками и Эко, пусть автор их и читал, а его похвалы Гуглу конца нулевых не пережили киберпанк Гибсона 1980-х, такие дела. Первое издание, перевод Апрелева, читается ……… Оценка: неплохо
akorish про Гор: Дикий прапор. Книга 3 (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
15 06 Читается легко, герой превратился в бессмертного благородного русского рыцаря в высокотехнологичном супер-мега-звездолете. Оценка: отлично!
akorish про Гор: Дикий прапор. Книга 2 [СИ] (Боевая фантастика, Космическая фантастика, Попаданцы, Самиздат, сетевая литература)
15 06 Неплохая книженция, юмор присутствует, очень приятно, что упомянул Крым ))) Оценка: отлично! |
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Изменить размер шрифта стиля "Сноска" и "Оглавление" на ЗНАЧИТЕЛЬНО отличающийся от основного текста и проглядывать при распознании в FineReader. Найденный кусок вырезать, копировать в блокнот и возвращать копированием из блокнота.
Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]Тема обсуждалась Голмой около двух месяцев назад, ссылку найти не могу.
Спасибо! Значит тема закрыта
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Сноска http://lib.rus.ec/node/367351
Но там о том что часть нормальный текст вдруг может быть распознан как сноска нет!
Так что какой то смысл в моём сообщение есть :-)
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы - всё, лежащее ниже пустой строки или отбивки * * *.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Isais]Там нет. Есть ниже. Я говорил, что FR11 может счесть сноской текст до половины страницы
Спасибо! Именно так! Ну что ж, известно кто учится на своих, а не на чужих ошибках! В общем я пока буду в ворд- там просто смотришь в конец файла и все сразу понятно!! Скачал последний билд, но вряд это это поправио!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Совершенно верно. :)
Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Метод борьбы с этими ошибками был уже описан Desenchantee. :)
Что касается самостоятельной расстановки сносок силами самого ФР, то качество этой версии хоть и намного лучше, но всё равно 100%-ной гарантии правильной расстановки нет.
Поэтому я предпочитаю пользоваться старинным методом: переношу текст сноски к слову, к которому она относится, заключая его в фигурные скобки. В ФБЕ потом эти сноски расставляются одним кликом.
В документальной литературе, где сносок очень много, сноски так не расставляю. Но после экспорта в фб2 методично - страница за страницей - проверяю сноски на наличие в боди "Примечание". Недостающие добавляю. Да, часто их текст оказывается после всего текста, но не менее часто он просто отсутствует.
При количестве сносок более 200 - этот способ всё равно более рациональный, на мой взгляд.
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote golma1]Сейчас, перед тем, как работать с текстом в ФР, я проделываю следующие операции:
- объединяю все стили сносок в один (если их всего два, то смысле объединять нет - как правило, один из них с курсивом, который при объединении может потеряться) и придаю им размер шрифта 6-7.
- каждому стилю "основной текст" придаю размер шрифта 10 (их не объединяю, поскольку при этом теряется форматирование курсивом и полужирным)
- все стили колонтитула объединяю и придаю им размер шрифта 6-7
- все стили заголовка объединяю и придаю им размер шрифта 20-26
- все стили оглавления объединяю и придаю им размер шрифта 30, курсивность и жирность.
Нажимаю "ОК" и жду, пока ФР объединит все шрифты.
Такой способ позволяет на 100% выявить неверный стиль при распознавании. В том числе, ту его часть, которая внизу страницы была распознана как сноска, - по размеру шрифта.
Отличный способ с гарантией!!!!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Небольшое техническое дополнение - мне так удобнее. После объединения, находите первую сноску, нажимете кнопку стили, далее OK и сноска окрасится зелёным цветом. Далее листа страниы (Alt+стрелка) вы видите зелёные куски текста - это и есть область СНОСКИ!!! Так очень быстро можно посмотреть весь проект! Ярко зелёная область просто бросается в глаза!
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
Кстати говорят есть новый билд. Кто ни будь на нём пробовал? У меня 11.102.481 прошлогодний
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Отв: Внимание! При экспорте из FineReader 11 в fb2 возможно ...
[quote Desenchantee]11.0.102.583 - те же ошибки. Обещали исправить в 12, но когда он будет...
Спасибо что предупредили! Скачал из торрентов собирался ставить. Мой совет ребятам из Фр - сделайте опцию "различать" и "не различать"! После таких шуток, когда полстраницы обычного текста превращается в сноску, лучше без! И конечно хорошо бы, что бы экспорт из ФР был управляемый - если я сделал стиль сноска то это и есть сноска!