Проект по вычитке книг, подобный альдебарановскому и олдмаглибовскому.

Форум пока очень неудобный для этого, так что пока будем обсуждать здесь... Понятное дело, мы и сейчас вычитываем... некоторые люди. их мало. И это просто не очень организованно пока, кустарно что ли... ;) я предлагаю "сплочиться" =D просто собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.) Выглядеть все будет таким образом... кто-то заказывает (в смысле, предлагает ее для вычитывания) вычитку книги - кто-то эту вычитку выполняет. СПИСКИ "НА ВЫЧИТКУ", "НА OCR" И СПИСОК УЧАСТНИКОВ - ЗДЕСЬ. FAQ: > Не сочтите за наглость но если работа предстоит с фантастикой/детективами/любовными романами то тогда извините но отказываюсь сразу. Работа ведется во всех направлениях - любые жанры и стили литературы, даже не только художественной =) что хотите то и выбираете) > С каким форматом предстоит работать? с fb2. наиболее распространенный в рунете и наиболее удобный формат для чтения и редактирования =) общая информация здесь и тут в нем нет ничего сложного, просто надо более-менее помнить теги. это просто. к тому же, вы будете эти теги коррекировать, а не создавать с нуля. ;) 1. общая информация о формате 2. описание тегов и простой пример книги. 3. как сделать книгу 4. Вычитка, редактура и создание fb2-файла с начала и до конца, с помощью FictionBook Designer 4.0 и не только 5. несколько статей и инструкций по fb2 6. Создание электронных книг в формате FictionBook 2.1: практическое руководство > Условия, правила вычитки, форматирования? правил форматирования почти нету за счет того, что инфа об абзацах, эпиграфах и т.д. хранится в тегах а не стилях (болд, италик и т.д.); правила вычитки только в процессе создания, пока прорабатывается. сейчас главное - вычитка.) [quote]а теперь главное! в этом посте: вносим свои предложения, предлагаем идеи, предлагаем книжки для вычитки, делимся планами, высказываем свои мысли и т.д.)) (не знаю, как выразиться лаконичнее)))[/quote]

Комментарии

Вопрос к тем кто разбираются в fb2 - в чем разница етих двух книжек - нужно оставить только одну
http://lib.rus.ec/b/100034
http://lib.rus.ec/b/99487
по размеру одна вдвое больше, а иначе выглядят одинаковыми /подробно не смотрел однако/.

И вообще нужен совет - как процедировать при разруливания дублей в библиотеке, если размер существенно разный - а все другое выглядит одинаково?
Оставлять то что побольше, или то что поменьше...?

В данном конкретном случае это, вероятнее всего, какой-то глюк репорта размера. Я скачал оба fb2 - они одинакового размера, 375,862 bytes.

Не подумал проверить;)
Спасибо за инфу, послал в форум - топик про баги, думаю там Ларин читает.

Надо смотреть на кодировку fb2 (первая строка файла). Иногда размер больше только за счет того, что кодировка UTF-8, а не 1251...
Лучше смотреть по источнику опубликования и дате, но тоже не панацея :(

Разгребшись с делами, a little, готов предложить и свои услуги :)
К сожалению, источник "бумажной" литературы у меня накрылся, но могу распознавать, оформлять в fb2 и вычитывать. Опыт всего этого есть, с форматом fb2 знаком давно и хорошо :)))

Аватар пользователя Грейт

[удалено]

Аватар пользователя Грейт

Взял Гиппопотама, правда, не вижу, зачем здесь нужна дополнительная правка, все сносно выполненно, но может, все же, найду какие опечатки.:)

я читал другое его произведение - Лжец - так там было ошибок до хрена просто))
а этот файл делался тем же человеком, так что, скорее всего здесь тоже будет.

ps. будь осторожен, потому что автор иногда не очень приятно открывает свою излюбленную гомосексуальную тему... так что в общем... предупредил))

Цитата:
Список на ocr:
3. Кристофер Прист. Лотерея

Насколько я понял, Лотерея уже есть в сети под названием "Подтверждение", так что OCR-ить ее наверное, не стоит.

во-первых, ее не скачаешь с литреса, во-вторых, у меня перевод не Колесникова, а Пчелинцева.

но все равно спасибо вам огромное!! если еще что нибудь найдете в списке, то пишите. ;)

Аватар пользователя Грейт

Ага, я уже внимательным глазом кучу этих ошибок исправил.:) да не страшно, и не такое читали и смотрели! Только на себе не испытывали, слава Бушу! А Приста сканить стоит;)

Грейт написал:
Ага, я уже внимательным глазом кучу этих ошибок исправил.:) да не страшно, и не такое читали и смотрели! Только на себе не испытывали, слава Бушу! А Приста сканить стоит;)

ага! то беж ошибки там все таки обнаружились?)) в Гиппопотаме?)
ps. не забудьте пож-ста сделать кодировку utf8. ;)

Могу сканировать/распознавать/вычитывать (какое-то время работал корректором в периодическом издании).
Не перевариваю историю, философию, Кастанеду etc.
Готов взяться за технические тексты, хотя предпочёл бы киберпанк (привет бывшему земляку А. Тюрину).

kiber написал:
Могу сканировать/распознавать/вычитывать (какое-то время работал корректором в периодическом издании).
Не перевариваю историю, философию, Кастанеду etc.
Готов взяться за технические тексты, хотя предпочёл бы киберпанк (привет бывшему земляку А. Тюрину).

технические тексты?
вот есть например залитая в fb2 книга http://lib.rus.ec/b/98109
надо ее привести в нормальный вид, используя это: http://www.ergeal.ru/txt/archive/cs/ppo/index.htm

возьметесь?

Готов по мере сил принять участие в вычитке:
английский и немецкий - все, кроме любовных романов
русский - околонаучные и технические тексты, "серьезная литература"

В небольшом объеме занимаюсь также сканированием, но в основном в формат DjVu.

Stiver написал:
Готов по мере сил принять участие в вычитке:
английский и немецкий - все, кроме любовных романов
русский - околонаучные и технические тексты, "серьезная литература"

В небольшом объеме занимаюсь также сканированием, но в основном в формат DjVu.


спасибо. как что появится - сообщу.
Аватар пользователя Грейт

Soshial, ага. В некоторых местах даже пропущены частицы вроде "не".:) а в FBE менять кодировку можно?

Грейт написал:
Soshial, ага. В некоторых местах даже пропущены частицы вроде "не".:) а в FBE менять кодировку можно?

я просто умоляю тебя отвечать именно в тех ветках, в которых разговариваешь.
под каждым сообщением есть кнопочка "ответить" или "цитировать".
спасибо.
ps. насчет кодировка - там это должно быть. в FBD точно есть.
Аватар пользователя Грейт

Извиняюсь.:) так нормально? Просто я плохо разбираюсь во всех этих кнопочках.:)

спасибо большое. так нормально.
просто если делать как ты раньше делал(а), очень загромождается тема и сложно рахзобраться в ветках обсуждения.
извини, если что.

Здравствуйте! Могу я взять книжку из списка для вычитки?

Аватар пользователя Грейт

Необходимую вам книжку нужно просто скачать, и после этого можно заниматься вычиткой:) Только не забудьте написать здесь, что взяли.;)

angel22 написал:
Здравствуйте! Могу я взять книжку из списка для вычитки?

записываю.
а что за книжку то берете? )

Андрей Валентинов. Что-то (?)

Вы не могли меня в список по вычитке книг.

Взял Терри Пратчетт. Море и рыбаки. Попробую свои силы на маленьком произведении.

Здравствуйте!
Я возьму Урсула Ле Гуин "Обездоленный", если можно.

записал вас. спасибо.

А что, есть сканы Биргера? Я бы взяла. Но без сканов нет смысла.

"Сырой" текст для вычитки после сканера+ocr лучше, например, отправлять на централизованный почтовый ящик, чтобы текст с многочисленными ошибками не попал в библиотеку. Доступ к ящику только у администратора проекта. Он отдаёт текст только тому/тем, кто возмётся за вычитку и последующую обработку (форматирование в fb2, выкладывание в библиотеку).
Короче, нужен почтовый адрес для отправки "сырых" текстов на вычитку.

зачем?
каждый что хочет, то и вычитывает.
мы вычитываем, в основном то, что уже находится в библиотеке.

Зачем тогда заявлять

soshial написал:
собрать организованную кучку ocr-щиков и вычитывающих, которые будут друг другу помогать.)
?

Скажем, у меня сканер выдаёт какие-то тексты. Прежде чем их куда-то положить, надо их вычитать, потом сделать из него книжку (например, в формате fb2). Либо это буду делать я сам, либо кто-то другой. Т.е. надо для полученного "сырого" текста найти желающего его вычитать и передать ему текст. Вот тогда и будет смысл в проекте. А сейчас "каждый за себя...".

ты немного не понял)
ты ocr'ишь и распознаешь (до ocr у меня просто пока руки не дошли), выкладываешь на файлообменник fb2 - я публикую ссылку - мы вычитываем.
если что-то не так - скажи.

soshial написал:
fb2

Это не по мне. Я этот формат не использую. Тексты-полуфабрикаты получаются в текстовом формате. Иногда rtf, если курсивов/жирных шрифтов/разреженных шрифтов много.

soshial написал:
я публикую ссылку

Это не по мне. Полуфабрикат не должен попадать неопределённому кругу лиц, а только нескольким желающим продолжить работу над будущей книгой.
Народу же надо выкладывать готовую книжку, а не конструктор "сделай сам".

1. пусть все будет сразу в fb2. это удобнее, потому что вычитывать приходится иногда уже сгенеренню в fb2 книжку.
2. полуфабрикат и так уже находится в общем доступе, на сайте.
так что скрывать что либо просто не имеет смысла.

Вот... Качество было на хилую троечку. Много окровский ашипок, безтирешные диалоги, битые абзацы, дупленые страницы... В общем, хотел почитать, не смог, пришлось вычитывать :( Подожду с годок, почитаю. Так чта, у нас версия покруче чем на альдеБаране будет :)))

chaus написал:
Вот... Качество было на хилую троечку. Много окровский ашипок, безтирешные диалоги, битые абзацы, дупленые страницы... В общем, хотел почитать, не смог, пришлось вычитывать :( Подожду с годок, почитаю. Так чта, у нас версия покруче чем на альдеБаране будет :)))

спасибо большое. ;)
Аватар пользователя Грейт

Умер мой ноутбук. Пропали все книги. Пропали черновики романа, над которым я работал. Пропало все. Пока не куплю новый, вычиткой заниматься не смогу.:(

ты роман писал???
прикольно. а о чем?
и почему не бэкапил?(((

Аватар пользователя Грейт

О духовном совершенствовании.:D Скидывал файлы на флешку, но за час до того, как узнал о его смерти, все удалил.:)

ну со флешки тогда всё восстановить - просто не проблема.
20 минут и 5 кликов и всё готово, так что не расстраивайся=)
главное, до этого момента ничего нового на флешку не записывать!!!

Аватар пользователя Грейт

У меня на ней тридцать мегабайт свободных осталось. А как восстановить? Я слышал, что нечто подобное можно проделывать с жесткими дисками, но чтобы с флешками... Впервые.:)

та прога которую я юзал: recover my files но мне кажется что должна быть прога получше =(

Грейт написал:
Умер мой ноутбук. Пропали все книги. Пропали черновики романа, над которым я работал. Пропало все. Пока не куплю новый, вычиткой заниматься не смогу.:(

Попробуйте вынуть диск и прицепить к другому компу - авось не все пропало. У меня, было дело, СынкПад помер. Но, как оказалось, слухи были преувеличенными - причина оказалась в одном неудачно расположенном плохом секторе на диске, из-за чего Винда не грузилась, показывая Blue Screen of Death. Я вынул диск, прицепил к другому компу и смог прочитать все свои файлы. Потом прошел несколько раз chkdsk и вообще все заработало.

В процессе вычитки находится Isaac Deutscher "Russia after Stalin". Может правда занять некоторое время :)

В скачанном с lib.rus.ec файле обнаружены следующие опечатки:

:s/товраищи/товарищи/
:s/состоящне/состоящие/
:s/значло/значило/
:s/Чо ж/Что ж/
:s/встречной силой, ее более мощной/встречной силой, еще более мощной/

как мне кажется, исправить самому намного быстрее, чем постить все опечатки здесь.
это делается с помощью самого элементарного текстового редактора.
тот же notepad.

Про нотепад - ты не прав.
Вносится действительно тривиально. Хотя... Вероятно стоит вынести на обсуждение и согласовать логику внесения изменений в номер версии.

Публикую же я их для случая согласования/объединения правок в ситуации когда разные люди вносили разные правки в один и тот же исходный файл.
И, честно скажу, не всегда доходят руки до залить исправленную версию. Если кто-то сделает это за меня - я совершенно не обижусь (+ вопрос, поднятый в первом абзаце).

Форматирование - пиздец полный.
Приведение его в соответствие с надлежащим качеством - предмет отдельного разговора.
Пока же - опечатки. Не претендуя на полноту :(( (порядка середины книги было уж слишком плохое настроение):

:s/чаше/чаще/
:s/толстые Стекла/толстые стекла/
:s/поддерживатькак/поддерживать как/
:s/беспомЬщио/беспомощно/
:s/которыесами/которые сами/
:s/экрномическую/экономическую/
:s/ве хватало/не хватало/
:s/об. рядом/обрядом/
:s/Лола/Пола/
:s/Тогдато/Тогда-то/
:s/Отед/Отец/
:s/вспомшц/вспомнил/
:s/восетановить/восстановить/
:s/удается укрыться от полиции/удастся укрыться от полиции/
:s/впределенных/определенных/
:s/Ой завернул/Он завернул/
:s/Пел/Пол/
:s/кабияу/кабину/
:s/стаиовилвеъ/становились/
:s/пианияо/пианино/
:s/дотора/доктора/
:s/изпод/из-под/
:s/закрытася/закрываться/
:s/Фиинерти/Финнерти/
:s/Кронерспросит/Кронер спросит/
:s/чтолибо/что-либо/
:s/ЭГТИКАК/ЭПИКАК/
:s/бшл/был/
:s/слишкЪм/слишком/
:s/тблько/только/
:s/инженербм/инженером/
:s/псевдриндейский/псевдоиндейский/
:s/Лэщер/Лэшер/
:s/дужно/нужно/

Латынина "Нелюдь": распознана, сейчас вычитывается.

Страницы

X