V170848 Два капитана
Опубликовано ср, 20/10/2010 - 11:37 пользователем Рыжий Тигра
Forums: Два капитана Изобилует ошибками сканирования/OCR - по 3-5 ошибок на страницу. На самом деле это не отдельный "с нуля" скан книги (равно как и его первоисточник - восьмой том "Библиотеки приключений" в формате .doc в библиотеке Ершова), а скопипизженный из более ранних источников текст, разбавленный иллюстрациями. По крайней мере, тексты этот и http://lib.rus.ec/b/68345 идентичны - отличаются только наличием-отсутствием точек в названиях глав. :-( Чтобы убедиться - достаточно поискать фразы из первого абзаца первой главы первого тома: "Двор сеял у самой реки, и по веснам", "а потом вода принесла и осторожно положила на берег я самого почтальона". Правильный, без "осканок", текст есть у Гугль-бука (http://books.google.com/books?id=GPsoPTBc7fsC&pg=PA7&dq=%22%D0%B0+%D0%BF%D0%BE%D1%82%D0%BE%D0%BC+%D0%B2%D0%BE%D0%B4%D0%B0+%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0+%D0%B8+%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE+%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0+%D0%BD%D0%B0+%D0%B1%D0%B5%D1%80%D0%B5%D0%B3+%D0%B8+%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE+%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&hl=ru&ei=AhO_TLeAOYKQjAf_oYWbAg&sa=X&oi=book_result&ct=result&resnum=1&ved=0CCgQ6AEwAA#v=onepage&q=%22%D0%B0%20%D0%BF%D0%BE%D1%82%D0%BE%D0%BC%20%D0%B2%D0%BE%D0%B4%D0%B0%20%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0%20%D0%B8%20%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE%20%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0%20%D0%BD%D0%B0%20%D0%B1%D0%B5%D1%80%D0%B5%D0%B3%20%D0%B8%20%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE%20%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&f=false) (как извлечь текст - не знаю; изображения страниц получить можно, но это 150 dpi от силы) и http://my-shop.ru/shop/books/441482.html (на странице ссылка "Заглянуть внутрь") (фрагмент - первые 20 страниц и оглавление). Если кто знает, где можно получить полный текст, - отзовитесь!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 1 день
konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 дня Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 4 дня fixel RE:Пропал абонемент 5 дней sem14 RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 недели sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 4 недели Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 месяц sem14 RE:Серия "Символы времени" издательства "Аграф" 1 месяц tvv RE:faq brainstorm =) 2 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 месяца Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 2 недели larin RE:абонемент не обновлен 2 месяца sem14 RE:За иллюминатором (серия) - чего не хватает? 2 месяца sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 2 месяца Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 месяца tvv RE:DNS 2 месяца MrMansur RE:<НРЗБ> 2 месяца Впечатления о книгах
udrees про Джадсон: Каждой твари – по паре: Секс ради выживания (Биология, Научная литература: прочее)
21 03 Очень интересная научно-популярная книга, давно такой не читал, посвященная теме размножения и секса в дикой природе. Написана в живом и юморном стиле, в каждой главе начало показано как обращение какого-нибудь живого существа ……… Оценка: отлично!
udrees про Брукс: Лелит Гесперакс: Королева Ножей [ЛП] (Эпическая фантастика)
21 03 Не очень люблю читать истории про темных эльдаров с их сумасшедшими загонами насчет пыток и постоянных убийств. Тут относительно небольшая история одной великой суккубы – Лелит, как всегда интрига с борьбой с потенциальной ……… Оценка: неплохо
udrees про Френч: Ариман: Вечный (Эпическая фантастика)
21 03 Читать истории про легионеров Тысячи Сынов немного сложновато из-за их погруженности в книги, заклинания и метания в паутинах варпа. Простых добрых сражений с мечом и болтером, как у других легионов, куда как меньше, и много ……… Оценка: хорошо
udrees про Володин: Газлайтер. Том 11 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
21 03 Как понятно из 10й книги, эта посвящена полностью войне с Китаем, империей Хань. Как и вся книга, которая предельно несерьезная, примитивная, то и война такая же несерьезная, как детская войнушка. На нее собираются совершенно ……… Оценка: неплохо
udrees про Вааль: Достаточно ли мы умны, чтобы судить об уме животных? (Биология)
21 03 Прочитав эту книгу об умственных способностях животных, я так и не получил доказательств разума у братьев наших меньших. Половина книги или больше посвящена шимпанзе, которые справедливо считаются самыми умными среди животных. ……… Оценка: неплохо
iggy71 про Сашар: Я не верю в монстров [There’s a Boy in the Girls’ Bathroom ru] (Детская проза)
20 03 Шедевр. И перевод великолепный. Оценка: отлично!
iggy71 про Буайе: Ромашка. Легенда о пропавшем пирате [litres] (Исторические приключения, Морские приключения)
20 03 Эту муть мог сочинить только ИИ или наркоман. Оценка: плохо
Barbud про Алексеев: Стрелочники истории (Альтернативная история, Научная фантастика)
19 03 Сдохли бы два взрослых мальчика в силуре. Атмосфера тогда была не слишком подходящей для человека и нынешних животных - кислорода еще мало, на пределе для дыхания, углекислоты слишком много. Возможно, какие-нибудь роющие млекопитающие ………
mysevra про Лобанов: Охотник на творцов (Боевая фантастика, Детективная фантастика, Самиздат, сетевая литература)
17 03 Идея просто замечательная, а воплощена спустя рукава. Не знаю, может, мне просто претит излишняя несерьёзность и простота изложения. Какое-то оно чересчур комедийно-залихватское. Оценка: неплохо
mysevra про Гумилёв: Открытие Хазарии [историко-географический этюд] (История)
17 03 Не, ну это на любителя, господа. Вот я – любитель, поэтому перечитываю. Оценка: отлично!
mysevra про Абакумов: Модератор реальности (Боевая фантастика)
17 03 Вроде и сюжет закручен, и идея неплохая, но события так вязко и затянуто изложены, что я не дочитала. Оценка: неплохо
francuzik про Осадчий: Приключения смекалистого мага жизни (Фэнтези, Самиздат, сетевая литература)
17 03 Долго ждал продолжения истории о Петре Птахине. И это случилось. Автор правда другой, но написано ничуть не хуже. Оценка: отлично! |
Отв: V170848 Два капитана
Мне принесли книгу 8й том библиотеки приключений. Возьмусь вычитать и сверить, тем более, что это совпадает с моим желанием перечитать произведение. Сканировать вряд ли буду, но будем посмотреть... ;-)
Отв: V170848 Два капитана
Так что прошу прощения, что пытаюсь кого-то припахать, :-) но лучше отсканируй и поделись сырым сканом. 300 dpi, 8-бит серый, можно завернуть в JPEG 80-90%. Иллюстрации тоже имеет смысл переделать - их лучше сканить в 600 dpi и упаковывать беспотерьным сжатием (PNG); если поверх ч/б иллюстрации почёркано какими-ньдь карандашами или фломастерами - можно восстановить, но тогда её скан должен быть в цвете.
Я сейчас добиваю "Восставшую Луну" Хайнлайна, до конца недели сделаю и смогу заняться "Двумя капитанами": для начала отOCR'ю и сравню (кстати, давно пользуюсь вот таким способом - http://www.flibusta.net/node/83676#comment-192053), а если особого эффекта не даст - тогда уже буду делать по старинке, с вычиткой и правкой...
Отв: V170848 Два капитана
SergeyR, сорри, но личка, похоже, не ходит - отзовусь тут:
> причем предпочтительно именно в том виде и с тем текстом, как я его помню! ;-)
Дык аналогично! :-) Правда, я его читал в другом издании - серо-голубая картонная обложка с рисунком - Саня и Николай Антонович, - но рисунки были те же.
> думал, что глазами вычитать будет проще, а, теперь даже и не знаю...
Я на такое тоже нарвался - как раз когда купил сканер и сделал первые книги: http://lib.rus.ec/b/184697 и http://lib.rus.ec/b/184698 - они на процентов 80 совпадают, глазами я выловил по паре сотен опечаток, а на сличении двух файлов - где-то с полтысячи. С тех пор и держу на вооружении методику http://www.flibusta.net/node/83676#comment-192053 - помогает даже при вычитках с одного и того же текста, а тем более если это с разных сканов.
> думаю, что вряд ли нужно сканировать иллюстрации в 600 dpi, потом все равно ведь придется загрублять до 72.



Загрублять - да (хотя до 72 - это уже слишком). Но при прочих равных с 600-dpi'йной однобитной картинки можно с аккуратным сглаживанием уменьшить до 120-150-dpi'йной, с 300 dpi предел - 75, а с исходного 150 dpi даже 50-dpi'йная будет выглядеть довольно похабно. Это раз. Два - при 600 dpi при чистке исходного серого скана хорошо видна природа дефектов картинки - то ли это мелкая деталь изображения, то ли сопля от размазанной краски, то ли щепочка в бумаге; при 300 dpi этого не видно - приходится напрягать фантазию; да и дорисовывать погибшие мелкие детали при большом разрешении удобнее.
Вот в качестве примера - последний рисунок к книге "Сироты квартала Бельвилль" (все рисунки можешь глянуть здесь):
сырьё - 600 dpi, 256-серый:
готовый - 600 dpi, однобитный ч/б (день ушёл на чистку, но зато ж смотрится! :-) ):
готовый для книги - 133 dpi, 7 уровней серого:
(все три кликабельны и увеличиваются)
> но все равно частенько на месте раздела страниц бывают "тени" [...] Правда это существенно только для рисунков.

Для готовых рисунков - однобитных - это как раз пофиг, а при реставрации плавным градиентом плотности фона можно пренебречь, а перед формированием однобитного я такие вещи обычно затушёвываю/забеливаю вручную. Куда хуже - перекос линий возле корешка.
Кроме того, если сканируешь файн-ридером, то для текста надо включать режимы "делить страницы" и "исправлять перекос" - тогда ФР ищет что0то похожее на почти горизонтальные строки текста и "выпрямляет" их; представляешь, во что он может превратить рисунок? :-) А рисунки ФРом сканировать таки удобно - но в отдельный проход и с выключенными коррекциями и делением на страницы.
Кстати, картинки можно делать и без теней, и даже почти без геометрических искажений, если ложить книгу на сканер корешком вдоль хода каретки так, чтобы корешок был как можно ближе к середине каретки:
(серый - корпус сканера, тёмно-серый - стекло, синий - книга, красный - границы рисунка)
> Мне [...] оказалась приписанной как "автору" книга "Русская кухня: Традиции и обычаи" http://lib.rus.ec/b/191031
Кто-то уже успел исправить раньше, чем я до неё добрался.
Отв: V170848 Два капитана
Единственное, что меня хоть немного убеждает в необходимости 600-dpi'шного сканирования, так это возможная правка, конечно, природа дефектов будет видна лучше. А вот "72 - это уже слишком", почему "слишком"? никто же ведь не собирается печатать с fb2 (хотя такие вопросы-пожелания я слышал, но это уже, по-моему извращение...). А разрешение читалки, на которые fb2 и рассчитан, иногда или от 72 далек, или точки такого размера, что разрешение рисунка все равно не спасет. Вот сейчас "размер" страницы в скане получается что-то порядка 1800х1200 точек. Некоторые из рисунков книги такого же размера. Хорошо есть и мЕньшие. Да и в fb2 ведь рекомендуется делать иллюстрации, что-то порядка, не более 300х400, поправьте, если ошибся. Вот и получается, куда же еще бОльшее разрешение, только в расчете на гипотетическую правку.
Иль я в чем-то ошибаюсь?.. 8-)
Отв: V170848 Два капитана
Лично я привык делать 482×728 - такая картинка как раз умещается в страничку CoolReader 3.0.28 в полноэкранном двухстраничном режиме на "рабочем столе" 1024×768, а на экране "буки" остаётся с полсантиметра полей. Но уже перехожу на 580×740, благо последние раскопки :-) в алгоритме сжатия PNG позволяют упихать штриховую картинку такого размера в 50-100 килобайт. (Однобитная 600-dpi'йная полностраничная (2600×3800) штриховая иллюстрация, кстати, после чистки ужимается до примерно такого же размера.)
Отв: V170848 Два капитана
Ну в общем, как говорится: "Не прошло и года..." ;о) Книга наконец сделана, вычитана и выложена -
http://lib.rus.ec/b/241172
Спасибо Рыжему Тигре, что он сподвиг меня на сканирование, иначе вычитывание отняло бы куда больше времени и сил!
В принципе должен заметить, что каких-то глобальных потерь текста ранее имевшийся в библиотеке вариант не имел, разве что досадные ошибки типа: "дом сеял", да и то не слишком многочисленные.
Но все равно не жалею, что сделал работу заново. Зато теперь я в своей книге уверен, как это не глупо и не самоуверенно звучит... ;о)
Но все равно, если будут замечания просьба написать, сюда или в личку.
Более того, как уже написал в комментарии получил большое удовольствие от чтения, чего и вам всем желаю!
Отв: V170848 Два капитана
Отв: V170848 Два капитана
Спасибо огромное! И сподвигнувшему, а особо сделавшему!
Ещё может быть старую версию удалить стОит?