Вы здесьFineReader 11: вниманию книгоделов!
Опубликовано вс, 11/12/2011 - 06:12 пользователем golma1
Уважаемые коллеги! В ФР11 обнаружился серьёзный баг. А именно: фрагменты текста, распознанные в стиле "Оглавление", при сохранении напрямую в fb2 исчезают бесследно. Способов борьбы с багом, учитывая, что простая замена стиля (и даже объединение стилей НЕ в пользу "оглавления") ничего не приносит, оказалось немного. 1. После распознавания захожу в редактор стилей (рядом с названием стилей кнопка с сине-красной буквой "А") и смотрю, есть ли там стиль "Оглавление". Для полной уверенности сохраняю только эту страничку в fb2, чтобы проконтролировать сохранность фрагмента. Если кто-то найдёт более изящный способ побороть этот баг, пожалуйста, делитесь.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
konst1 RE:Переименовать ник (имя учетки) 12 часов
sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 день sem14 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 4 дня Океана RE:Подайте бедному копеечку на книжку с литреса... 2 дня Larisa_F RE:Современная корейская литература. Книжная серия... 2 недели Larisa_F RE:Таррин Фишер 2 недели Aleks_Sim RE:Беженцы с Флибусты 2 недели Саша из Киева RE:Как приобретать друзей и оказывать влияние на людей 2 недели Isais RE:Семейственность в литературе 3 недели miri.ness_ RE:Доступ 27 3 недели bmusanov Оплатил, но абонемент не отображается 3 недели holla RE:Багрепорт - 2 4 недели konst1 RE:Файнридер для Win11 1 месяц larin RE:Оплатил, но абонемент не отображается 1 месяц sem14 RE:Книжная серия «Сlio» издательства "Евразия" 1 месяц Isais RE:Национальный конкурс на лучшее литературное произведение... 1 месяц Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 1 месяц Впечатления о книгах
svetik489 про Капба: На золотом крыльце - 2 (Киберпанк, Городское фэнтези, Самиздат, сетевая литература)
01 09 а чего тут такого восхитительного? так на троечку,с натягом... Оценка: неплохо
udrees про Каку: Физика невозможного [Physics of the Impossible: A Scientific Exploration into the World of Phasers, Force Fields, Teleportation, and Time Travel ru] (Физика, Научпоп)
31 08 Увлекательно прочитать про возможности и открытия, которые могут быть доступны в ближайшие сотню лет или больше. Книга немного уже устарела, информация базируется видимо на сведениях 2006-2007 годов. Сейчас в 2025 году часть ……… Оценка: хорошо
udrees про Роузвуд: Джеффри Дамер. Ужасающая история одного из самых известных маньяков в мире [litres] [Jeffrey Dahmer: A Terrifying True Story of Rape, Murder & Cannibalism ru] (Биографии и Мемуары, Публицистика, Документальная литература)
31 08 Кому интересно почитать про историю ужасных преступлений Джеффри Дамера – почитайте книгу. Она достаточно подробно на 50 страницах описывает его похождения и убийства мужчин, без особых кровавых подробностей, хотя описания ……… Оценка: неплохо
udrees про Мантикор: Зеркало Мисы (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
31 08 Как увлекательно становится читать долгую историю приключений друида, который по силе невероятно прокачался по ветке РПГ, что практически стал богом, когда он натыкается на препятствия и противников, которые сводят на нет ……… Оценка: отлично!
Stager про Дроздов: Зубных дел мастер (Космическая фантастика, Попаданцы, Самиздат, сетевая литература)
31 08 Ну это даже не третьесортная литература. Это вообще не литература. Ещё это редкое говно по содержанию. Неожиданно для Дроздова. У них там в Белоруссии так плохо? Оценка: плохо
Amfortas про Бачигалупи: Навола (Социальная фантастика, Городское фэнтези, Историческое фэнтези)
30 08 Скучно. Невыносимо скучно. Не одолел, бросил на половине. Слащавый "роман воспитания" с кучей банальных деталей. Повествование, ведущее в никуда. Не спасает даже стилизация под итальянское Возрождение. Лучше почитать словарь. Веселее и более интригующе. Оценка: плохо
Олег Макаров. про Юдковски: Гарри Поттер и методы рационального мышления [Harry Potter and the Methods of Rationality ru] (Фэнтези, Фанфик)
30 08 Один из лучших в мире специалистов по критическому мышлению написал фанфик по Гарри Поттеру для того, чтобы большее количество людей заинтересовались критическим мышлением. Представляете, что получилось? Оценка "отлично". ……… Оценка: отлично!
Олег Макаров. про Капба: На золотом крыльце - 2 (Киберпанк, Городское фэнтези, Самиздат, сетевая литература)
30 08 Капба это Капба. К его книгам не читайте аннотаций, читайте сами книги. 5 баллов это недостаточное количество баллов. Оценка: отлично!
Sello про Мережковский: Петр и Алексей (Историческая проза)
30 08 Поздновато, конечно, я разобрался, почему "не прет" мне Мережковский - лишь с третьей попытки, на третьем романе серии. Потому что там, где религия перетягивает на себя одеяло в ущерб историческому повествованию, истина, всегда, ……… Оценка: неплохо
mysevra про Эйрес: Оззи. Автобиография без цензуры [I Am Ozzy ru] (Биографии и Мемуары)
29 08 Несмотря на множество грустных моментов, книга просто пропитана оптимизмом и юмором. Возможно, местами позитив слишком уж натужный, но по-другому никак не выжить в некоторых обстоятельствах, тут тянешь себя за волосы как Мюнхгаузен. Оценка: отлично!
mysevra про Тюльбашева: Лес (Ужасы, Триллер, Мистика)
29 08 Слишком "мыльный" привкус. Где, собственно, события? Заблудились, пропали, шли, шли, поели макарон, шли, шли, совсем пропали. Часть вторая… Оценка: плохо
mysevra про Васильев: Легкий заказ [СИ] (Городское фэнтези, Самиздат, сетевая литература)
29 08 Мило, но слишком кустарно. Продолжение читать не хочется. Оценка: неплохо |
Комментарии
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Потому что сразу в фб2 гораздо удобнее. Гораздо.
Отв: FineReader 11: вниманию книгоделов!
Я бы ещё после "Гораздо" поставила три восклицательных знака. ;)
Отв: FineReader 11: вниманию книгоделов!
А мне не понравилось...
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кроме фб2, сохраняю в док (ред. копия), текст (формат. текст) и пдф. Любые пропажи/потери восполняются из копий.
Отв: FineReader 11: вниманию книгоделов!
Да, я тоже сохраняю в доке, редактируемой копией. И даже изготавливаю из него фб2, чтобы удобнее было сравнивать с полученным. Но работаю с файлом, полученным сохранением сразу в фб2.
Преимущества: нет проблемы с тире в диалогах, со списками (когда исчезают цифры), с потерей форматирования.
Пока набранная статистика сравнения говорит о том, что при исправлении бага со стилем "оглавление" ничего больше не теряется. Я ещё какое-то время понаблюдаю, но потом необходимость в изготовлении "контрольного экземпляра", надеюсь, отпадёт.
Кстати, ещё одна подробность: при сравнении файлов док (вернее, фб2, полученное из дока) и фб2 (полученного сразу из ФР) обнаружилось, что ошибки распознавания различаются.
Например: в доке "осколько" - в фб2 "о сколько", т.е. в доке отсутствует нужный пробел.
Откуда берётся - непонятно. :(
Отв: FineReader 11: вниманию книгоделов!
Напоролся на аналогичную граблю, когда (в ФР9) делал "Назад к Мафусаилу": длиннющая пьеса, часть имён персонажей распозналась с разрядкой, часть - с пробелами. Решил через левое полужопие, зато быстро: сохранил в .doc, из него опен-офисом в его родной XML'ный, открыл .xml руками, нашёл нужный стиль и заменил разрядку на жирность, опять открыл опен-офисом, сохранил в .doc, открыл m$ wordviewer'ом и скопипастил в FBE2.
Отв: FineReader 11: вниманию книгоделов!
Кстати в ФР11 напоролся на такую весчь: если ФР сам(!) не распознал сноску как "сноску", то заставить его это понять даже используя стиль "сноска" мне не удалось. Или текст сноски вставлялся непосредственно в текст, где и как ему вздумается, либо, если я выделил сноску отдельной областью, то может и вообще потеряться.
Может кто-нибудь научит: "Как с этим бороться?!"
Отв: FineReader 11: вниманию книгоделов!
Выскажите все претензии на их сайте http://finereader.abbyy.ru/forum/actualforum.aspx. Я там много чего высказал. Кое-что обещали исправить, кое-что подсказали.
Отв: FineReader 11: вниманию книгоделов!
В самой программе Вы ничего изменить не сумеете. Как Вам уже правильно подсказали, нужно жаловаться на сайте разработчика.
Для борьбы с этим багом есть два способа.
1. Положиться на ФР, а потом проверить каждую сноску, добавляя пропущенные.
2. При просмотре (я надеюсь, Вы просматриваете каждую страницу после окончания автоматического распознавания ;) ) переносить текст сноски к слову, заключая его (текст) в фигурные скобки. Потом, уже в fb2, они расставляются одним кликом при помощи соответствующего скрипта.
Каждый выбирает наиболее приемлемый для себя и для конкретного случая. :)
Отв: FineReader 11: вниманию книгоделов!
Спасибо за ответ!
Но чтобы ТАМ жаловаться нужно иметь как минимум лицензионную(!) версию. ;-) Я же, как думается и многие здесь, пока еще игрался с пиратской.
Подсказанные мне Вами способы "борьбы" мне известны и были используемы мною, только это как-то "не кошерно" что-ли. ;-) А потому предпочитаю "добрую старую" ФР9 с выводом текста в Word, с промежуточным редактированием и последующим ручным переносом в FBE (все равно получается ручная работа, что тут, что там, только в моем случае я сам контролирую работу и знаю, что я делал, а в случае ФР11 никто не знает что ему "взбрело в голову сделать" ;-) ).
Кстати еще один камень в огород ФР11: он почему-то отказывается запускать установленный у меня Word 2003 - "не находит" его! :-(
Отв: FineReader 11: вниманию книгоделов!
По-моему, это необязательно.
Но в любом случае: об этом баге уже сообщили.
Не могу с Вами согласиться. ФР11 работает в разы (!) быстрее и распознаёт текст значительно лучше. Кроме того, он поддерживает ручное форматирование: добавленный курсив/болд при сохранении в fb2 перенимается, чего не происходило в более ранних версиях при сохранении в доке.
Да и вообще у него много приятных фич: одно только объединение стилей чего стоит. ;)
А если добавить сюда решение проблемы "тире в диалогах" и списков, то, на мой взгляд, сравнивать обе версии просто не приходится. :)
Насчёт поддержки Word2003, похоже, это у Вас локальный баг. У меня работает. На одном компе стоит 2003, на другом 2007 - в обоих случаях без проблем.
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Кстати, если покупать с русской страницы, то за Home версию получается не так-то уж и много, что-то в районе $40-45. Imho, для большинства хоббистов-OCR-щиков сумма вполне "подъемная".
Отв: FineReader 11: вниманию книгоделов!
Home не умеет распознавать ни дежавюшки, ни PDF-ки, только отдельные картинки. Может ли она результат распознания сохранить в нечто удобочитаемое или нужен только копипаст? Короче, Home-версия - это заманка для дураков. Кто покупает Home, тому потом дают скидку 20% на Professional. Об этом у них на форуме где-то было написано.
Отв: FineReader 11: вниманию книгоделов!
Не знал; спасибо, что объяснил! Ну, что тут я могу сказать - они сами себе "злобные Буратино", в таком случае. Платить $170 за Pro версию - это, чисто психологически, для индивидуального пользователя слишком много. Значит, как воровали, так и будут воровать. Думаю, что в самом Abbyy они это прекрасно понимают, но держат такую цену, чтобы не демпинговать на корпоративном рынке.
Отв: FineReader 11: вниманию книгоделов!
Привет! Сохранять в fb2 - но это ничего не даёт - ни сносок, ни разделов! Зачем? Разумно в Word или OpenOffice.Writer а оттуда в fb2! Про плюсы FR11 - скорость очень возросла, много удобных мелочей - показ последней отсканированной страницы в процессе сканирования, и т.д.
Отв: FineReader 11: вниманию книгоделов!
Брехня
Отв: FineReader 11: вниманию книгоделов!
Судя по вашему собачьему юзерпику Вы хотели сказать - "Истинно так!" или можно разбивать на секции? Да или нет?
Отв: FineReader 11: вниманию книгоделов!
Судя по зековско-наркоманскому юзерпику, у вас другие интересы. ;-))
Как правило результат в фб2 разбит на секции и проставлены сноски. Не без ошибок. да. Но 90% проставлено верно.
Так, что не нужно "утверждать", а нужно просто попробовать и убедиться в своей неправоте
Отв: FineReader 11: вниманию книгоделов!
Любезностями обменялись! Но м.б. вы забыли или не знали, что "Беломор Канал" это знаковые (протестные!!!) папиросы для части НТР в прошлом веке! Но оставим это. Так в FineReader 11 можно указать как разбивать на секции при импорте в FB2? Интересно - надо попробовать!
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Что значит Если они корректно выделены на бумаге то есть что выделено на бумаге до сканирования? Если не трудно разъясните, это бы ускорило работу! Спасибо
Отв: FineReader 11: вниманию книгоделов!
Отв: FineReader 11: вниманию книгоделов!
Слово библиотекаря - закон! Со следующей недели ухожу в Новогодний Запой до 10 января!
Отв: FineReader 11: вниманию книгоделов!
Привет всем! Читаю блог решил попробовать передать из F11 в fb2 напрямую - сноски перекинулись, но разбиение на главы ни в какую! Это есть или нет? Как этого достичь? Мне годится любой способ. Скажем для экспериментов с F11 я doc файл сохранял в PDF а потом его (PDF) "распознавал" в F11
Отв: FineReader 11: вниманию книгоделов!
Вообще-то это в первую очередь зависит от качества распознавания, которое, в свою очередь, зависит от множества параметров, не в последнюю очередь от гарнитуры, которой набрана книга.
Проверьте, каким стилем распознались заглавия. Если этот стиль везде одинаков, но НЕ заголовок, объедините его с одним из заголовков в пользу последнего.
Если стили везде разные и тоже НЕ заголовки, поменяйте в каждом конкретном случае на стиль "заголовок" (любой).
Должно помочь. :)
Однако, на самом деле, это не так существенно даже при том, что ФР не распознал правильно заглавия. В ФБЕ есть замечательный скрипт под названием "Разбиение на секции". Если главы начинаются с одинакового слова, например "Глава" или "Рассказ", то достаточно ввести в первую строку скрипта это слово и нажать на кнопку "Обработать" (или "Обработать и выйти"), то скрипт сам всё сделает.
Полезно перед словом ввести знак ^ - означающий начало строки.
Скрипты - наше всё. Надо только уметь их готовить. ;)
Отв: FineReader 11: вниманию книгоделов!
Уважаемая golma1! Так как все эти возможности ещё в процессе опробования, то создал тестовый файл и с ним пробовал разные варианты
Меня устраивает такой путь -
Спасибо за ответ! Посмотрим что нам ответят в эбби!
Отв: FineReader 11: вниманию книгоделов!
Насчёт стиля "Оглавление" в ААВВYY вообще-то уже было сообщено. И даже ответ получен. ;)
А вот о стилях для правильной разбивке на главы, это интересно. Спасибо. :)
Отв: FineReader 11: вниманию книгоделов!
Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
В целом сохранение в fb2 мне нравится намного больше, чем сохранение в doc, после которого добавляются ещё и ошибки конвертации. ;)
Но это, опять-таки, вопрос личных предпочтений.
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Для художественной литературы, где количество сносок невелико, или в крайнем случае - умерено, я предпочитаю переносить текст сноски к слову.
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Посмотрим что ответят, хотя ставлю 90% против 10% ничего не ответят
Отв: FineReader 11: вниманию книгоделов!
Согласен - в отличии от реальной книги, где текст сноски как правило находится на той же странице перед глазами читателя, в e-book в него надо "нырнуть", что разбивает процесс чтения, плэтому полностью согласен с вами, что всякие пояснения типа перевода ин. слова qqqq (ффф - на лат. яз) переносятся к слову
Но тем самым меняем замысел автора а это не есть хорошо ;-)
Ой, Вы меня неправильно поняли.
Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски.
По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт форму выведения сноски, он лишь соединяет цифру и текст. Всё остальное зависит от желания (умения) программистов читалок. :)
Отв: FineReader 11: вниманию книгоделов!
[quote golma1]Ой, Вы меня неправильно поняли. Я переношу текст сноски к слову при распознавании. Для того, чтобы уже в fb2 одним движением расставить все сноски, причём правильно. ;)
Поэтому итог - такой же, как и при разрешении ФР самому расставлять сноски. По вопросу удобства пользования сносками: некоторые читалки отображают сноски внизу "страницы" (читай: экрана). Сам формат fb2 не задаёт фор
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Тут некоторое время делал наблюдение кто чем и как читает в давке в общественном транспорте. Поразила меня одна девица щупленькая, небольшого росточка, которая в одной рук держала том Стига Ларссона (там наверное все три девицы были в одном флаконе) Всё спасибо!
Отв: FineReader 11: вниманию книгоделов!
Понял, что не понял! Про e-book ( а не читающие программы) - при размере 6" внизу сноска? А разве есть такие? Все lbook-и показывают примечания внизу страницы и 5 и 6-дюймовые - в последних прошивках там стоит coolreader. Если места на странице для показа всего примечания не хватает - прихватывается следующая страница.
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Отв: FineReader 11: вниманию книгоделов!
Есть отдельные coolreader-ы для pocketbook-ов любой модели - 3xx, 6xx, 9xx - устанавливаются простым копированием во внутреннюю память и добавлением ссылок в ini-файл.
Это из тех, с чем сам имел дело.
Добавлю, что последняя версия AlReader2 тоже имеет опцию показа сносок внизу страницы. Работает под WindowsMobile.
Отв: FineReader 11: вниманию книгоделов!
Рассказываю о своём способе решения описанной в начальном постинге проблемы.
В редакторе стилей все "Оглавления" (если их больше одного) объединяю в один стиль (отметить все нужные стили и нажать кнопку вверху "Объединить").
Для полученного таким образом стиля устанавливаю маленький размер шрифта, полужирность, курсив и выбираю непривычный шрифт.
В результате встречающийся в тексте стиль "оглавление" резко отличается от основного текста, что облегчает его обнаружение. Не помню, писала ли, поэтому расскажу ещё раз.
"Инфицированную страницу" копирую в блокнот (не в Word! он сохраняется форматирование), а потом снова копирую - из блокнота в ФР. Если на странице есть форматирование, восстанавливаю.
Кстати, аналогичную процедуру стала проделывать со сносками, объединяя все стили в один и придавая ему атрибуты, резко отличающие от основного текста. Это позволяет легко обнаружить части текста в нижней трети страницы, отделённые от предыдущей части, если они распознаны как сноски, что случается довольно часто.
Иллюстрация:
Отв: FineReader 11: вниманию книгоделов!
уважаемая golma1! пож добавьте к списку глюков (т.к. вы МОЖЕТЕ :) им сказать)... во ВСЕХ версиях ФР (начиная с 6 и кончая 11), при распознавании украинских текстов, при встрече конструкции типа "молодчага. Її" ВСЕГДА определяется как "молодчага. її"... :(
а то уже задолбало вручную править...
Отв: FineReader 11: вниманию книгоделов!
Попробую. :)