Вы здесьТекстовый pdf из сканов
Опубликовано чт, 09/12/2010 - 08:07 пользователем golma1
Forums: Текстовый pdf, сделанный из сканов, - намного удобнее для хранения и при вычитке, чем любой другой вариант. Я только не очень поняла, какие вопросы при этом возникают. ;)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 1 день
DGOBLEK RE:Прошу переформатировать, распознать, etc... 6 дней akorish RE:Регистрация 1 неделя Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 неделя konst1 RE:Ух, как я не люблю спамеров! 1 неделя tvv RE:DNS 4 недели sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 4 недели larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца Впечатления о книгах
udrees про Яу   : Теория струн и скрытые измерения Вселенной [The shape of inner space. String Theory and the Geometry of the Universe's Hidden Dimensions ru] (Физика, Астрономия и Космос)
10 05 Я могу только процитировать одного ученого из этой книги, чтобы описать свое отношение к этой книге: «…Я обнаружил статью Яу в библиотеке и мало что из нее понял, но из того немногого, что мне удалось понять, я сделал однозначный ……… Оценка: хорошо
udrees про Вальтер: Мешок. Библия вселенной [справочник] (Боевая фантастика, Приключения: прочее, Самиздат, сетевая литература)
10 05 Очень короткое описание, буквально на 5-6 страниц, по сути не произведение, а глоссарий терминов из Вселенной Мешка. Написано просто, без всяких заумных терминов. Я правда не понял, это опечатка или что («Но камни с тварей ……… Оценка: неплохо
udrees про Вальтер: Я её нашёл, но... (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
10 05 В общем-то нормальное продолжение, главный герой действительно нашел свою невесту, я правда ожидал, что это «но…» будет длиться всю 3-ю книгу, но автор видимо не стал растягивать драму и воссоединил возлюбленных для новых ……… Оценка: хорошо
udrees про Вальтер: Браконьер 6 (Боевая фантастика, Приключения: прочее, Постапокалипсис, Самиздат, сетевая литература)
10 05 Отличное завершение серии про приключения Брака. Написано с душой, описания красочные, много крови, стрельбы и трупов. Язык главного героя грубый, раздраженный, повелевающий. Ну и плюс надо учитывать, что 6-я книга – это как ……… Оценка: отлично!
udrees про Вейр: Антигипоксант [Antihypoxiant ru] (Научная фантастика)
10 05 Еще один коротенький рассказ про возникновение зомби-апокалипсиса. Как говорится, благими намерениями вымощена дорога в ад, и научные открытия всегда несут в себе свою долю опасностей. Читать интересно. Оценка: неплохо
udrees про Вейр: Яйцо [The Egg ru] (Научная фантастика)
10 05 Коротенький рассказик со своей концепцией о жизни после смерти, смысле существования и Боге) мне понравилось. Оценка: неплохо
udrees про Емельянов: Первый игрок [litres] (Боевая фантастика, Фэнтези, Попаданцы)
10 05 Давно не читал такой книги, тем более в жанре литРПГ, попаданцев, чтобы сюжет был сильно усложнен внутренней борьбой и интригами. Сам автор метко написал об этом в одной главе: «Очевидно, что каждый вокруг ведет свою игру, ……… Оценка: хорошо
Никос Костакис про Вязовский: Восход Красной Звезды [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
09 05 Мы первые, придумали снимать телевизионное сопровождение, для наших песен. Никто на Западе, такого не делает. ___________________ Кто может пояснить необходимость хотя бы одной запятой?
mysevra про Филатов: Про Федота-стрельца, удалого молодца [ёфицировано] (Юмористические стихи)
09 05 Ну, это уже классика. Что ни фраза, то шедевр. На все случаи жизни. Оценка: отлично!
mysevra про Прошкин: Смертники (Боевая фантастика)
09 05 О, да. Возможно, не канон, но это было замечательно. Обязательно прочту продолжение. Оценка: отлично!
mysevra про Уайт: Мост Дьявола (Полицейский детектив, Триллер, Детективы: прочее)
09 05 То ли это пресыщение, то ли плохо подано, но история вызывает скуку и недоумение. Любое убийство – бесспорно трагедия, но зачем об этом целую книгу писать, да ещё и так невыразительно? Оценка: плохо
alexgor1 про Иосиф Абрамович Рапопорт
09 05 «...у него никогда не было кабинета, у него не было практически стола, у него никогда не было секретаря, у него никогда не было машинистки, даже когда он был выбран член-корреспондентом». 14 марта 1912 года в Чернигове в ……… |
Отв: Текстовый pdf из сканов
Не надо цитировать мультики, википедию, и растекаться мыслями. Мы и без википедии знаем, что TIFF - формат без потерь, а JPEG - с потерями. Еще с тех времен, когда вики не было. Речь не о теории, а о практике конкретной работы.
но по факту распознается не хуже
Отв: Текстовый pdf из сканов
Если знаешь, зачем тогда людей в заблуждение вводишь "голословными измышлениями"?
По какому факту?
У нас с Вами факты разные:
я Вам про Фому, Вы мне про Ерёмуя Вам факты привел, Вы сказали, что факты неправильные. Чем они неправильные? Они что, дают неправильный мёд? Или просто обзываете то, что неугодно Вам "неправильными" фактами.Я тоже по факту говорю: распознание с TIFF лучше, чем с JPEG,а Вы отвечаете: "Это всё теория, а на практике всё наоборот!"
Если бы я ничего не распознавал, я бы с Вами может и согласился, но мне тоже приходилось распознавать, и поэтому я знаю, что и практика говорит то же самое, что и теория.
Отв: Текстовый pdf из сканов
А вот не надо. Не надо замусоривать ветку по конкретному вопросу своими измышлениями.
Откройте новую и расскажите там всем о том, что JPEG 300dpi в оттенках серого ФР "не любит". В-)
Отв: Текстовый pdf из сканов
Да я бы, как грится, с радостью.
Но тогда в этой ветке останутся измышления niksi, на которые, как покажется, никто не дал отпор!
Так что приходится тут, что ж поделаешь...
Отв: Текстовый pdf из сканов
Читать умеешь? НЕ НАДО БЫЛО НАЧИНАТЬ. ТЕБЕ.
Еще раз. Джпеги 300 и тифы 300 распознаются примерно с одинаковым кол-вом ошибок. Одно не лучше другого. Хочешь оспорить - приводи примеры. Одних и тех же сканов, распознанных с тифоф и джпегов, с указанием кол-ва ошибок в одном и другом случае. В новой теме. Иначе говорить не о чем. Я с удовольствием признаю, что не прав, если это будет ДОКАЗАНО.
Отв: Текстовый pdf из сканов
Да, пожалуйста.
И я там обязательно напишу, что ВСЕ сканы, полученные мною от niksi и Ronja_Rovardotter, распознаются с минимальным количеством ошибок. В каком формате и с каким разрешением они сделаны, расскажут сами сканировщики. В-)
Отв: Текстовый pdf из сканов
Реплика убойная!
Я ж не знал, что на мою вполне невинную реплику будет столь громкий ор с
метанием какашекобзывааниями.Отв: Текстовый pdf из сканов
Давно я так не веселился. :-)
Отв: Текстовый pdf из сканов
(хихикает) Вот мне всегда кажется, что если я понимаю, то уже тогда точно и все понимают, а вот поди ж ты... Не бывает JPEG без потерь. Вот просто не бывает и все. Бывает сжатие с максимальным качеством. Ага, для JPEG-ов максимальным. )))
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Видимо, необходимо все же отметить для тех, у кого еще не очень много опыта по оцифровке книг, что опытные и великолепные сканировщики, такие как niksi и Ronja_Rovardotter, и опытные и отличные OCR-щики, такие как Голма, обмениваются сканами именно в jpg, что значительно проще и быстрее. Такие сканы замечательно распознаются, и работать с их сканами - одно удовольствие.
Необходимо так же предупредить новичков об осторожности при принятии на веру утверждений и советов Zadd-а, т.к. в них энтузиазм и поспешность в суждениях, как правило, преобладает над знанием и умением. Полезно делать на это поправку, не отвергая, впрочем, и некоторой части его советов.
Отв: Текстовый pdf из сканов
Хм. Опробовал оба способа на 256-сером 300-dpi'йном скане, уже распознанном и (в меру возможностей ФР) вылизанном. У ФР получаются либо редкостно говённые картинки (даже акробат-ридер их через раз в упор не понимает), либо полноценные серые картинки, но сотни мег размера, зато с уже готовым текстом. У акробата - соответственно, ч/б картинки - ляля, размер на двух с чем-то сотнях страниц - меньше десятка метров, но текст никакой.
Ну и третий способ, который до сих пор юзаю, - выгрузить из файн-ридера однобитные ч/б картинки, их опять загрузить, распознать и сделать .pdf, - сочетает слабовыраженные недостатки предыдущих способов (картинка не особо хороша и текст так себе, размер в раза полтора побольше, чем после акробата).
А нельзя ли (ценой не чрезмерно больших трудозатрат) скрестить оба способа и получить файн-ридерный текст с акробатной картинкой?
Отв: Текстовый pdf из сканов
Сделать после распознавания в FR-е pdf по способу TaKir-а, но не для web, а с хорошим качеством, а потом ужать в Акробате готовый pdf?
Отв: Текстовый pdf из сканов
Отв: Текстовый pdf из сканов
Что-то Acrobat не хочет tiff-файлов...
Acrobat 9.0.0 а файлы цветные.
FineReader'ом из 75 страниц никак меньше 26 мегов pdf не получается.:(
Отв: Текстовый pdf из сканов
Таки получилось. Правда из другой книжки в сером цвете. 380 страниц - 15 Мегов. Очень хорошо.
Спасибо Голма!
Страницы