Вычитка #5 (2010-I)
Опубликовано пн, 04/01/2010 - 14:06 пользователем soshial
Forums: Теперь главная тема по вычитке здесь. Архив тем: таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: Книги из этого списка нуждаются в доработке: форматировании и вычитке. Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе. Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования. Присоединяйтесь к нам! :) golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"! Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Наш дом - СССР 14 часов
DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 7 часов babajga RE:Чернушка. Повести 22 часа Саша из Киева RE:Сказки далёких островов 2 дня babajga RE:Лопоухий бес 4 дня SparkySpirit RE:Жорж Санд - переводы 19 века 4 дня SparkySpirit RE:Прошу переформатировать, распознать, etc... 4 дня kopak RE:Таинственная личность админа Флибусты 5 дней babajga RE:Ежик покидает дом 5 дней babajga RE:Сказки бабушки Черепахи 6 дней babajga RE:Свист диких крыльев 6 дней Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Саша из Киева RE:Турецкие мусорщики в Анкаре открыли библиотеку, полную... 1 неделя Isais RE:Не тот автор 2 недели xieergai60 RE:Продление подписки 3 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 3 недели Isais RE:Древняя Греция. Читаем... 3 недели laurentina1 RE:Ирина Александровна Велембовская - Немцы 3 недели Впечатления о книгах
miri.ness_ про Еще не поздно
25 12 Двоякое впечатление. У автора, возможно, в родственниках или их друзей есть взрослые люди, крепко обиженные Ангстремом. Но много знающие про электронику и микроэлектронику тех лет - отсюда и довольно глубокие познания, правда ………
decim про Овалов: Демон революции. Жизнь и приключения Розалии Землячки (Биографии и Мемуары)
25 12 Рерайтинг имеющейся здесь же книги Овалова "Январские ночи", снабжённый манким заголовком. Оценка: хорошо
lorealke про Матвеев: Ниочёма-3 [СИ] (Юмор: прочее, Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
24 12 Автор постоянно долбит про злобную Европу и обижаемую Империю, да царя-батюшку. Читаешь и прямо физически ощущаешь, как тебе промывают мозги. Короче, вместо нормальной бояръаниме получилась какая-то полу-пропагандистская херня. Оценка: плохо
дядя_Андрей про Костин: О чём молчал Атос (Критика, Литературоведение, Самиздат, сетевая литература)
23 12 Karl-Ieronim, конечно же "Последний кольценосец" Еськова
Олег Макаров. про Николай Владимирович Беляев (самиздат)
23 12 Серия «Серебряная осень» Качественно, интересно
Саша из Киева про Краминов: В орбите войны [записки советского корреспондента за рубежом, 1939-1945 годы] (Биографии и Мемуары)
23 12 Огромное спасибо всем, кто сделал и добавил эту книгу!
Лысенко Владимир Андреевич про Емельянов: Японская война 1904. Книга 2 (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
23 12 Серия очень понравилась, прочитал не отрываясь. Буду ждать продолжения. Оценка: отлично!
Саша из Киева про Даниил Фёдорович Краминов
23 12 На Флибусте есть книга Даниила Краминова "В орбите войны. Записки советского корреспондента за рубежом. 1939-1945 годы". Надо бы добавить её сюда. Я попробовал добавить - почему-то не получилось. А книга интересная. Я читал ………
miri.ness_ про Забелин: Домашний быт русских цариц в XVI и XVII столетиях [Литрес] (История)
22 12 Книга отличная, только один минус - издано в 1869 г. в серии Non-Fiction. Большие книги
alexk про Флинн: В стране слепых [litres] [In the Country of the Blind ru] (Социальная фантастика, Научная фантастика)
22 12 На первый взгляд, литресный перевод похуже перевода 95-го года.
Fori про Панов: Пре(восход)ство [СИ litres] (Киберпанк, Социальная фантастика, Самиздат, сетевая литература)
22 12 Зачем выкладывать ознакомительные огрызки Литреса? |
Отв: Вычитка #5 (2010-I)
Не совсем понял как сообщить о готовности заняться вычиткой одной из предложенных к вычитке книг?
Б. Р. Скотт Падение святого города http://lib.rus.ec/b/170827 вычитать ошибки OCR
Опыта в этом деле у меня нет, но есть желание. Думаю, я смогу разобраться с "инструментарием" и оказать библиотеке посильную помощь.
Отв: Вычитка #5 (2010-I)
Считайте, что сообщили. :)
Будут вопросы, не стесняйтесь их задавать. :)
Отв: Вычитка #5 (2010-I)
начинаю задавать вопросы 8)
Вопрос 1.
Попытался заглянуть, но скачать её не получается по известной причине 8).
Есть какие-нибудь альтернативные ссылки, по которым можно свободно скачать эту книгу?
Вопрос 2. Где взять исходный FB2-файл выбранной на вычитку книги? Скачать оный по указанной вами ссылке http://lib.rus.ec/b/170827 снова-таки не представляется возможным:
Вопрос 3.
Что конкретно подразумевается под этим понятием? Достаточно ли просто исправлять замеченные ошибки и несуразицы по мере прочтения книги, или же требуется обязательное её сравнение с текстом бумажного оригинала? Как быть если бумажный оригинал для этих целей достать проблематично?
Отв: Вычитка #5 (2010-I)
На сайте автора: http://www.yuzzich.narod.ru/mybook1.htm
Отв: Вычитка #5 (2010-I)
1. Странно, что не скачивается Кондратович. Одно время был какой-то глюк, что вообще ничего нельзя было скачать, но вроде бы его исправили. Может быть, опять? :(
2. См. п. 1. Если не получится, сообщите мне свой мэйл в личку, я вышлю Вам файл.
3. 90% всех ошибок OCR можно исправить без оригинала - достаточно просто внимательно читать, а после ещё и пройтись скриптами. Но бывают, конечно, и спорные или вовсе не читаемые места. Если у Вас нет оригинала и достать его сложно/невозможно, оставляйте как есть. Возможно, имеет смысл в хистори упомянуть о том, что в книге остались ещё ошибки OCR.
RE:Отв: Вычитка #5 (2010-I)
Ещё есть вариант: сравнивать текст не с бумажным оригиналом, а с тем файлом, с которого делался OCR, то есть с фотокопией. Часто на сайт выкладывают файлы в формате PDF или DJVU - их можно жрать за исходную точку для сравнения. То, что программы распознавания распознают плохо, человеческий мозг может сделать гораздо лучше. Часто при сканировании некоторые символы или целые слова искажаются, расплываются и т.д. Вот, программы часто сбиваются в таких местах, но люди могут восстановить правильное слово по смыслу, если есть хоть небольшой намёк на правильное слово со стороны расплывающегося текста. Если PDF или DJVU файла нет на сайте, думаю, можно попросить его переслать того пользователя, который занимался OCR.
в какой кодировке сохранять книгу?
скажите пожалуйста какую кодировку делать в книге
оставлять, какая была или есть какие-то предпочтительные кодировки, типа utf-8? но при этом размер чуть увеличится...
редактировал книгу, она была в win-1251, сейчас у меня utf-8, размер сжатой возрос на 50кб, стоит обратно ее в win-1251 переводить?
Отв: в какой кодировке сохранять книгу?
Отв: в какой кодировке сохранять книгу?
Только utf-8. Размер не имеет значения.:)
Отв: в какой кодировке сохранять книгу?
ну и отлично, мне тоже ближе утф
единственное сомневался из-за размера файла и что возможно некоторые читалки для кпк/телефонов не смогут открыть файл в этой кодировке
Отв: Вычитка #5 (2010-I)
В процессе производства журнала Искатель №4 за 1988 выяснилось, что один из рассказов имеется здесь: http://lib.rus.ec/b/150420, но качество плохое - не вычитан. Поставил пометку "вычитывается".
Отв: Вычитка #5 (2010-I)
как можно принять участие в вычитке? Спасибо )))))))))))
Отв: Вычитка #5 (2010-I)
Вы можете присмотреть себе что-нибудь в таблице (ссылка в первом постинге) или выбрать что-нибудь по вкусу из файлов, сделанных LibRusEc kit'ом http://lib.rus.ec/stat/document-author/rusec, или просто читать нравящиеся Вам книги и заодно исправлять ошибки.
На странице редактирования книги следует делать пометку в поле "доп. инф." что-то типа "вычитывается" или "в работе". Чтобы не получилось дублирования.
Отв: Вычитка #5 (2010-I)
Рассказ Андре Рюэллана "Мемо" заменил на вычитанную версию - http://lib.rus.ec/b/180047. Кроме того добавил в библиотеку журнал Искатель, №4, 1988 - http://lib.rus.ec/b/180046, в котором этот рассказ имеется. Не знаю, прав ли...
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готов что-то повычитывать.
У меня интересы -- история, религоведение. Это означает что тут я лучше вычитаю.
Впрочем, могу вычитывать и то что есть.
Из гугльдока заинтересовало "Ла Сор Обзор Ветхого завета",однако оригинала у меня нет. Есть только doc файл с погаными сканами фотографий.
Из проблем есть то что я использую Linux и не уверен что есть готовые тлзы для создания/редактирования fb2. Но думаю что разберусь...
Так что заявку я оставил :)
Отв: Вычитка #5 (2010-I)
В "Обзоре Ветхого завета" пропущены куски текста. Если в Вашем доке они есть, то и он годится. :)
А откуда взялся Ваш док? Если по тем же ссылкам, что приведены в дескрипторе, то значит, и в нём текст не полностью.
Если Вы умеете распознавать и конвертировать другие форматы в fb2 (и найдёте способ делать это под Линуксом), можно просмотреть книги по жанрам:
http://lib.rus.ec/g/sci_religion
http://lib.rus.ec/g/religion_budda
http://lib.rus.ec/g/religion
http://lib.rus.ec/g/religion_rel
http://lib.rus.ec/g/religion_self
http://lib.rus.ec/g/religion_esoterics
Все файлы, сделанные LibRusEc kit'ом, нуждаются в обработке.
Если возьмёте что-нибудь в работу не из таблицы, оставьте на странице редактирования книги пометку в поле "доп. инф.".
Успехов! :)
Отв: Вычитка #5 (2010-I)
Приветствую всех!
Временами, читая книги в Вашей прекрасной библиотеке, поражаюсь вопиющей малограмотностью некоторых текстов. Хотел бы помочь с вычиткой (благо имею определенный опыт), но... как это реализовать на практике?
Можно ли править "на грамотность" читаемые тексты с их последующей перезаливкой?
И не будет ли это воспринято, как "нарушение авторских прав" и т.п.?
В ожидании ответа, WildKitten.
Отв: Вычитка #5 (2010-I)
Можно и нужно.
Почитайте вступительный пост (особенно ту часть, где говорится о форматах). Если Вам там всё понятно и Вы со всем согласны, можете смело править читаемые Вами книги.
Уточню: речь идёт о грамматических ошибках и форматировании. Всё остальное остаётся на совести автора.
Отв: Вычитка #5 (2010-I)
Поправил и перезалил книгу Тома Шарпа "Флоузы": http://lib.rus.ec/b/180361 Сделал, что мог, но правил в основном ошибки орфографические и огрехи OCR. Оформил стихи тэгом. Внес дополнительную инфу в Description.
Много вопросов у меня было по разбиению книги на абзацы, но поправил лишь явные случаи. При сомнениях оставлял так, как оно есть - такие вещи, ИМХО, лучше сверять со сканом или бумажным изданием. Поскольку не было ни того, ни другого, решил, что лучше не навредить.
Отв: Вычитка #5 (2010-I)
Большое спасибо. Абсолютно верное решение.
Отв: Вычитка #5 (2010-I)
Здравствуйте.Отметьте пож.в таблице - Питер Уоттс "Ложная слепота" вычитан, обновленную версию я залил в базу библиотеки.Встречались сложные понятия в тексте, не разобрать - то ли опечатки,то ли это переводчик так перевел научные термины.Решил оставить как есть.
Беру новую книгу на вычитку из таблицы - Орлов "Смело мы в бой пойдем...".Отметьте пож. в таблице.На страничке книги я отметился.Спасибо.
Отв: Вычитка #5 (2010-I)
Готов заниматься вычиткой. К кому обращаться?
Отв: Вычитка #5 (2010-I)
Добро пожаловать!
Сначала просмотрите таблицу, может быть, там найдётся что-то, над чем Вам интересно будет "поработать". Если нет, то в списке файлов, сделанных LibRusEc kit'ом, можно выбирать любой файл и дорабатывать его. Там всегда отсутствует форматирование и зачастую нужна вычитка.
Если найдёте что-то для себя интересное, сделайте пометку на странице редактирования книги в поле "доп. инф.". Мол, вычитывается. ;)
Отв: Вычитка #5 (2010-I)
Почему-то библиотека не принимает доработанные файлы обратно - пишет что файл слишком короткий и просит паковать стихи по сто килобайт.
Отв: Вычитка #5 (2010-I)
Вечер добрый! Я бы с удовольствием занялась вычиткой, но только текстовых файлов. Таблица не информативна, т.к., посмотрев интересующие меня книги, обнаружила, что в таблице они никак не отмечены цветом, а на странице самой книги отмечено, что она вычитывается.
Киньте в меня, пожалуйста, книжкой, которую нужно вычитать.
Отв: Вычитка #5 (2010-I)
К сожалению, вряд ли кто-то сумеет Вам точно указать такую книгу.
Попробуйте подобрать себе что-нибудь интересное здесь: http://lib.rus.ec/stat/tot, полистав файлы в форматах doc, rtf, txt.
Читайте и правьте заодно. :)
Но заранее сказать, что книга нуждается в вычитке, никто не сможет.
Ой, вспомнила! Вдруг Вам будет интересно:
http://lib.rus.ec/a/36186
Нужно вычитать оба doc-файла.
При этом нужно удалить номера страниц, проставить сноски (если они есть). Сноски можно проставить либо при помощи инструментов Word'a (постраничные сноски), либо поставив их в фигурные скобки за словом, к которому они относятся.
Нужно также провести небольшое форматирование - выделить заголовки и стихи.
Заинтересовала Вас такая работа? :)
Отв: Вычитка #5 (2010-I)
Взяла бы на вычитку вот эту книгу http://lib.rus.ec/b/170065 "Сереброкрыл". Только не понимаю как ее взять. Скачать не могу (хочет абонемент или пользу), а кнопки чтения нет.
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
Отв: Вычитка #5 (2010-I)
Сегодня еще читала Сергея Лукьяненко не помню точно как называется (что-то вроде "Беседы с дьяволом"). Он в фб2 (я с ним не работаю, пока), но в нем есть опечатки, неверные окончания и пропущенные запятые. Если мне не нужно вставлять никаких тегов (так, по-моему, это нзывается), я могу поправить текст и залить его заново?
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
по ссылке открывается пустая страница
Отв: Вычитка #5 (2010-I)
Пришлите мне в личку свой мэйл, я Вам вышлю.
Отв: Вычитка #5 (2010-I)
после того, как выслала мейл, смогла открыть страницу и скачать оттуда. Начинаю читать. Отметьте.
Отв: Вычитка #5 (2010-I)
В таблице этой книге нет. А на странице редактирования Вы можете самостоятельно отметить: в графе "доп. инф." проставьте "вычитывается". Или Вы и конвертировать будете? Тогда можно поставить "конвертируется".
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готова заняться Иосиф Бродский Стихи (2) http://lib.rus.ec/b/9097 разобраться в перемешанных стихах, отформатировать
а также Иван Бунин Дневники 1939-1945 годов http://lib.rus.ec/b/177214 вычитать, сделать структуру, расставить сноски
Отв: Вычитка #5 (2010-I)
Отлично! Занесла в таблицу.
Если Вы на странице редактирования книги сделаете пометку, тоже не помешает. ;)
Отв: Вычитка #5 (2010-I)
Взял на конвертацию в фб2 и вычитку книгу Руперта Шелдрейка "Новая наука о жизни" - http://lib.rus.ec/b/180809
Отв: Вычитка #5 (2010-I)
Взял на конвертацию и вычитку "Поколение свиней" Хантера Томпсона - http://lib.rus.ec/a/20018
Отв: Вычитка #5 (2010-I)
Добрый вечер! Отметьте пожалуйста в таблице, что Иосиф Бродский Стихи (2) вычитан.
:)
Отв: Вычитка #5 (2010-I)
Отметила. Спасибо!
Отв: Вычитка #5 (2010-I)
Отметьте, плиз. Взялся поправить массу ошибок в книге Стивена Кинга "Кэрри": http://lib.rus.ec/b/140451. Сравню с бумажным изданием
Хотел посоветоваться, как сделать лучше: Фактически книга состоит из трех частей, соответственно три секции. Примерно 30-40% книги составляют выдержки из книг, газет и т.д., выделенные тегом cite + внутри курсив или bold. В бумажном издании курсив и bold присутствуют также.
Вопрос у меня заключается в следующем: бегло вычитываю книгу с КПК в AlReader-е и то, что выделяется тэгом cite, да еще с дополнительным курсивом и bold-ом внутри выглядит, мягко говоря аляписто... Есть задумка назначить пустые строки подзаголовками, оставить выделение жирным и курсивом, а вот тэг cite снять - ИМХО, подобное форматирование книги будет выглядеть намного читабельнее и нагляднее, нежели просто выделение тэгом цитаты...
Отв: Вычитка #5 (2010-I)
Подождите, подождите. Я тоже читаю на КПК AlReader'ом и цитаты (cite) выглядят прекрасно. Все стили настраиваются под вкус читателя. Размер, цвет, начертание, отступы и т.д. Например, cite выделяется только цветом и отступами (можно и другим шрифтом), а курсив и bold на этом фоне ничего не портят.
Удалять стилевую разметку совершенно нет никакой необходимости! К тому же подзаголовки (subtitle), поставленные для пустых строк, улетят в FBE при первой же обработке скриптами.
В общем, я бы не советовал.
Отв: Вычитка #5 (2010-I)
Спасибо за замечания. Поэтому прежде и спросил, прежде чем действовать.
Тогда оставляю расстановку тэгов as it и правлю орфографию, расстановку абзацев, добавляю курсив, там, где он отсутствует. Все по бумажному изданию. В воскресенье выложу результат.
Кстати, видел в таблице Волки Кальи того же Стивена Кинга: http://lib.rus.ec/b/67272 Книга вроде бы как в работе с 23.02.09. Если актуально, могу взять на себя - опять же есть бумажный вариант книги, есть по чему править...
Отв: Вычитка #5 (2010-I)
<cite> не удалять ни в коем случае, если это цитаты!
курсив внутри цитаты не нужен, т.к. обычно в печатной книжке для того и выделяют курсивом, чтобы читатель понял, что это цитата! Если там все цитаты выделены и курсивом и болдом, то тогда IMHO, имеет смысл убрать курсив и болд, а вот <cite> лучше оставить.
Отв: Вычитка #5 (2010-I)
papamuller. Раз уж переделываете, найдите обложку покрасивее и русскую и иностранную, в сети их, как грязи. И хорошо-бы выходные данные русской книги в Дескрипшн и автора, название и год написания на английском. А так-же переводчика:) Не много прошу?:)
Отв: Вычитка #5 (2010-I)
Igorek67 Description уже заполнил - я обычно с него начинаю работу. Все данные внес. А обложку... Тогда попутный вопрос - если указывается ISBN книги, издательство ее выпустившее, допустимо ли замена обложки? У меня бумажный вариант в этом же исполнении, разве что цветопередача отличается? Можно ли здесь позволять какие-то вольности, или данные должны стыковаться: ISBN - аутентичная обложка бумажного издания?
Отв: Вычитка #5 (2010-I)
Да должны стыковаться. Если есть бумажный вариант, то лучше конечно обложку самому отсканить и сделать скажем 400 пикселей по горизонтали. Гораздо лучше, чем обложка с Оzona к примеру, где по горизонтали 200.
Сам я ставлю обложку и ISBN по одному изданию, а если есть поинтереснее обложка тоже кладу обычно в файл, как и иностранные, если есть. Уж у Кинга то есть:)
Отв: Вычитка #5 (2010-I)
papamuller, если будете добавлять иностранную обложку - не подцепляйте ее в дескрипшен как обложку (сайт именно ее и выберет для демонстрации на странице книги), разместите иллюстрацией в конце книги.
Отв: Вычитка #5 (2010-I)
Zadd, Нет, тэг цитаты оставляю точно. Часть книги сделана просто в виде отсыла к другим источникам - они как раз и цитируются. С курсивом там я разобрался - вместо него должны стоять обычные кавычки, так что спокойно их заменяю. В бумажном варианте было проще - там эта часть книги просто дается уменьшенным шрифтом. Смотрится очень даже, конечно. Ну а у fb2 инструментарий победнее, это понятно.
Igorek67, сделал бы это с удовольствием, был бы сканер в наличии. Но в этом году прикуплю обязательно.
Ronja_Rovardotter, спасибо за совет!
Да, собственно, спасибо всем помогающим здесь в теме таким вот "чечако" как я
Отв: Вычитка #5 (2010-I)
Уменьшенный шрифт можно делать при помощи тегов sub или sup.
Отв: Вычитка #5 (2010-I)
sub и sup не всеми читалками поддерживаются, а cite и есть cite, зачем его еще как-то особо выделять? Каждый читатель может настроить его вид у себя так, как ему нужно. Разве нет?
Страницы