вычитка #4 (2009-II)
Опубликовано вс, 23/08/2009 - 16:32 пользователем soshial
Forums: архив:
1. 2008-I
2. 2008-II — 2009-I
3. 2009-II
4. 2009-II (эта тема)
таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA
.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Nicout RE:Прошу переформатировать, распознать, etc... 15 часов
нэнси RE:Подайте бедному копеечку на книжку с литреса... 2 дня akorish RE:Регистрация 1 неделя Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 неделя konst1 RE:Ух, как я не люблю спамеров! 2 недели tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 1 месяц larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца Впечатления о книгах
SeNS про Boston: Токен за токеном (История, Околокомпьютерная литература, Научпоп)
13 05 Книга, на удивление, весьма "читабельная", и написана в стиле американских tech writers. Содержит весьма интересные исторические экскурсы, а также множество неизвестных широкой публике фактов. Настоятельно рекомендуется к чтению всем интересующимся ИИ/LLM. Оценка: отлично!
akorish про Роман Юрьевич Прокофьев
12 05 Стеллар оставил положительные чувства, хотя последняя книга была нудноватой лично для меня. Но это не отменяет, того, что время потрачено не зря.
akorish про Прокофьев: Архив Стеллара (Фантастика: прочее, Самиздат, сетевая литература)
12 05 Ну такое, как сноски почитать. Мне было уже не интересно. Оценка: неплохо
akorish про Прокофьев: Прометей [СИ] (Боевая фантастика, Героическая фантастика, Постапокалипсис, ЛитРПГ, Самиздат, сетевая литература)
12 05 Самопожертвование, и отвага, нудновато, но дочитано. Думаю, что эта книга была уже лишней, много затянутого. Сария стоящая, почитайте. Оценка: хорошо
akorish про Прокофьев: Сфирот [СИ] (Героическая фантастика, Фантастика: прочее, ЛитРПГ, Самиздат, сетевая литература)
12 05 Переносимся в космос, все еще интересно? Ну тако-то да, но уже нудновато.
akorish про Прокофьев: Эфемер [СИ] (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
12 05 Даат - как бы и нельзя договариваться, но и не договариваться нельзя ))) Что же за Дар? Сыр в мышеловке.
akorish про Прокофьев: Легат [СИ] (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
12 05 Оценка все еще Хорошо! Не так интересно как 1я и 2я, но еще интересно, новые союзники и новые враги. Читаем дальше. Оценка: хорошо
akorish про Прокофьев: Архонт [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Неожиданно интересно, новый уровень и новый замут. Читаем дальше.
akorish про Прокофьев: Мятежник [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Мысль такая, идет прокачка персонажа, уже не так захватывает, как предыдущие, но читается на интересе.
akorish про Прокофьев: Заклинатель [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 3я книга сдает позиции по отношению к предыдущим, но читать не надоедает. Оценка: хорошо
akorish про Прокофьев: Трибут [СИ] (Боевая фантастика, Героическая фантастика, Постапокалипсис, Технофэнтези, ЛитРПГ, Самиздат, сетевая литература)
12 05 Вторая книга не подкачала, легкое чтиво на сон грядущий. Хоть немного и не дотянула до первой, но читать стоит. Оценка: отлично!
akorish про Прокофьев: Инкарнатор [СИ] (ЛитРПГ, Самиздат, сетевая литература)
12 05 Первая книга залетела на ура! Прочитал как новый жанр, как игра в тексте. Ждал последующие книги. Однозначно рекомендую. Оценка: отлично! |
Отв: вычитка #4 (2009-II)
Прошу прощения за оффтоп, но что-то не сообразил хмурым утром куда правильнее тиснуть багрепорт: эта книга не скачивается в FB2, приходит пустой архив.
http://lib.rus.ec/b/146991
Отв: вычитка #4 (2009-II)
Постить сюда - http://lib.rus.ec/node/128849.
Архив у меня скачался полностью.
Отв: вычитка #4 (2009-II)
Уважаемые желающие поучаствовать в проекте "Вычитка"!
Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.
Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.
Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.
Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.
Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.
Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.
Если я что-то упустила или невнятно сформулировала, спрашивайте. :)
Отв: вычитка #4 (2009-II)
хорошие вводные слова.
ещё бы объяснить, что такое вычитка)
чуть доработать текст, и я буду вставлять его в каждую новую тему о вычитке)
Отв: вычитка #4 (2009-II)
Я добавила о вычитке. Если считаешь, что всё ОК, внеси этот текст в первый постинг, а остальные можно удалить. ;)
Отв: вычитка #4 (2009-II)
Фридрих Август фон Хайек "Индивидуализм" - вычитано, куда заливать?
Отв: вычитка #4 (2009-II)
Подождите немного или пришлите на почту библиотекарей bibliotekar.librusec (][) gmail.com.
Отв: вычитка #4 (2009-II)
Я читаю на смартфоне.
Соответственно, только rtf и без картинок.
Рука автоматически правит ошибки ocr и т.д.
Но правленый текст в rtf никому не нужен?
Отв: вычитка #4 (2009-II)
Если текст был до того в FB2, то его опять нужно будет переводить из RTF обратно - это довольно заморочно, только если уж очень много ошибок, имеет смысл это делать.:(
А если он и был в библиотеке в RTF, то очень даже нужен - все равно конвертировать.
Отв: вычитка #4 (2009-II)
Хотела бы помочь с вычиткой книги "Обзор Ветхого Завета" (http://lib.rus.ec/b/139286) Книгу скачала, fb2 редактор тоже. Но не совсем ясно, что означает в данном случае фраза из гугл-дока "сравнить с оригиналом и тщательно вычитать, добавляя пропущенный текст". Где находится оригинал - по вышеприведенной линке? Пишите! Как только разберусь - поставлю соответствующую отметку в документе о том, что начата вычитка.
Спасибо :)
Отв: вычитка #4 (2009-II)
Здравствуйте!
У меня есть несколько вычитанных книг - вычитывала для себя, не претендуя на общественное признание. Просто ужасно не люблю читать неаккуратный «расхристанный» текст. А потом подумала, что добро зря пропадает.
Вас это может заинтересовать?
Зоя.
Отв: вычитка #4 (2009-II)
Может заинтересовать. :)
В каком виде находятся вычитанные Вами книги? Если в fb2, то нет вопросов: заливайте или присылайте библиотекарям.
Если в другом варианте, а на сайте есть fb2, то надо смотреть каждую книгу - насколько значительны изменения.
Отв: вычитка #4 (2009-II)
FB2.
A кому присылать, куда заливать? Не хочется плодить лишние сущности.
Отв: вычитка #4 (2009-II)
На странице редактирования книги внизу есть линк "заменить на другую версию". Воспользуйтесь им. (Кстати, не забудьте в fb2 увеличить версию на 0.1).
После заливки, если предыдущая книга автоматически не заменилась, воспользуйтесь там же линком "объединить с другой книгой". Очень важно не просто удалить предыдущий вариант, а заменить его.
Попробуйте на одной какой-то книге, если не получится, сообщите о проблеме. :)
Отв: вычитка #4 (2009-II)
Попробовала на одной книге и сообщаю о проблеме :)))
Загрузка валится где-то в середине процесса.
Отв: вычитка #4 (2009-II)
Расскажите чуть подробнее. ;)
Что за книга, какого размера?
Отв: вычитка #4 (2009-II)
Эммануил Казакевич. Весна на Одере. :)))
Размер FB2 файла 851 кВ. Размер zip-архива 340 кВ.
В общем ничего экстраординарного :)))
Я понимаю, что эта книга не самый хит сезона :))), но как я уже говорила, я вычитывала ее для себя - вдруг захотелось перечитать такую древность :)))
Отв: вычитка #4 (2009-II)
Попробуйте залить на этой страничке: http://lib.rus.ec/a/17897 (Эммануил Казакевич - алиас).
И попробуйте не паковать файл, а заливать сразу fb2.
Сначала попробуйте здесь http://lib.rus.ec/b/26161/edit выбрать "заменить на другую версию".
Если почему-то не получится, попробуйте залить здесь: http://lib.rus.ec/a/17897/addbook/. Книги должны объединиться автоматически. Если нет, будем дальше думать. :)
Отв: вычитка #4 (2009-II)
Сейчас попробовала залить с работы. Ситуация несколько изменилась :)
Теперь я получаю вот такой экран ошибок:
Вы уверены что это FB2? Fatal Error 76: Opening and ending tag mismatch: document-info line 4 and id in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4 Fatal Error 76: Opening and ending tag mismatch: description line 3 and history in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4 Fatal Error 76: Opening and ending tag mismatch: FictionBook line 2 and document-info in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4 Fatal Error 5: Extra content at the end of the document in /www/ocr/Kazakevich_Vesna_na_Odere.26161.fb2 on line 4 Найдены ошибки! Error 1872: The document has no document element. on line 0 Плохой, негодный файл Файл прошел валидацию в FictionBook Editor и в fb2validator из fb2utils-0.6.0.
Отв: вычитка #4 (2009-II)
Пришлите мне файл на мэйл. Адрес сообщу Вам в личку.
Мы его всё равно зальём. ;)
Отв: вычитка #4 (2009-II)
Хммм... Не получилось.
Ошибки:
Просмотрела все тэги, всё, вроде, на месте. FBI ошибок тоже не находит.
Для желающих посмотреть файл и найти ошибки:
http://rapidshare.com/files/320224468/Kazakevich_Vesna_na_Odere.26161.fb2.html
Отв: вычитка #4 (2009-II)
Исправил - http://lib.rus.ec/b/176122
Отв: вычитка #4 (2009-II)
Спасибо.
Но интересно знать, в чём там было дело.
Отв: вычитка #4 (2009-II)
Честно скажу, не до конца и сам понял. В FBE файл признавался как валидный. Но поскольку валидатор Либрусека сопротивлялся, начал файл перекраивать. После заливки версии 1.2, вдруг обнаружилось, что некорректно проставлены сноски.
По-моему, это проделки FBTools, с помощью которого был сделан fb2.
Отв: вычитка #4 (2009-II)
Не-а... В оригинальном fb2 файле сносок не было вообще :))) Я их ручками расставляла. Так что может что-то и накосячила :))), хотя читалка все воспринимала нормально.
А вообще - большое спасибо за помощь. Это был мой первый блин, и что-то он оказался уж очень комом :(((
Отв: вычитка #4 (2009-II)
Не давайте себя сбить с толку. ;) Вы сделали отличный файл. А глюки у каждого бывают.
Кроме того, с нашими знатоками Вы не пропадёте. :)))
Отв: вычитка #4 (2009-II)
Перезалила «Дом на площади». На этот раз получилось с первого раза :)
В общем, процесс пошел. :) У меня еще мноооооооооооооого чего завалялось :)
Отв: вычитка #4 (2009-II)
Отв: вычитка #4 (2009-II)
Отв: вычитка #4 (2009-II)
Очень странно. :-о
Отв: вычитка #4 (2009-II)
А вы заливаете fb2 или zip?
Подобные сообщения у меня были когда у архива тип ZIP был написан большими буквами, если же исправить на zip, то всё проходило нормально.
Отв: вычитка #4 (2009-II)
Я заливала fb2.
Мне уже помогли залить этот первый блин :)
Там была какая-то проблема со сносками, как выяснилось.
Но в любом случае большое спасибо за желание помочь :)
Отв: вычитка #4 (2009-II)
Не понимаю, как можно поправить название и номер серии. При попытке добавить серию - сообщение: "слишком много вариантов", ранообразные варианты ввода имели тот же результат. Номер книги в серии поправить можно, но кнопки "сохранить" не вижу. Подскажите пожалуйста, как это сделать (систематизирую свою библиотеку, заодно бы и всем пользу принесла), не перезаливать же из-за такой ерунды.
Отв: вычитка #4 (2009-II)
Чтобы разговор был более предметным - какой сериал и куда именно вы хотите добавить?
Отв: вычитка #4 (2009-II)
Сахаров Андрей Николаевич - Александр III (серия: Романовы. Династия в романах № 12 ) - это только в качестве примера.
Отв: вычитка #4 (2009-II)
Если серия уже есть (как в вашем случае), то сначала нажимаете линк "удалить", а потом заново прописываете название сериала и номер - кнопку сохранить тоже увидите.
апд А вы уверены в номере? В серии под №12 значится "Петр III".
Отв: вычитка #4 (2009-II)
Спасибо, попробую. Номер у этой книги 19, прошу прощения за опечатку.
Отв: вычитка #4 (2009-II)
Уважаемые господа!
У меня есть книга известного писателя Владимира Короткевича. Но она в виде вордовских файлов по главам. Можно ли выслать куда нибудь эти файлы, чтобы умные люди сделали из них нормальную книгу FB2, а то я далек от программирования и т.п. А книга безумно интересная и поистине гениальная "Колосья под серпом твоим".
Ответьте мне, лучше в личку. Извините, если это глупый вопрос
Отв: вычитка #4 (2009-II)
Нормальный вопрос. :)
Соберите главы в один файл и выложите в формате doc. Кто-нибудь обязательно переконвертирует.
Отв: вычитка #4 (2009-II)
Можете скачать наши две книги про БОТАНИЧЕСКИЙ САД (http://bogard.isu.ru/books/bgisu_resources_2005.pdf) и про САДОВУЮ ТЕРАПИЮ (http://bogard.isu.ru/books/ht_2006.pdf).
1) Кузеванов В.Я., Сизых С.В. Ресурсы Ботанического сада Иркутского государственного университета: научные, образовательные и социально-экологические аспекты. Иркутск: Изд-во Ирк. гос. ун-та, 2005.- 243 с. (на русском языке)
http://bogard.isu.ru/books/bgisu_resources_2005.pdf (5 Mb, полная электронная русская версия)
2) Сизых С.В., Кузеванов В.Я., Белозерская С.И., Песков В.П.
Садовая терапия: Использование ресурсов ботанического сада для социальной адаптации и реабилитации. Справочно-методическое пособие. Иркутск: Изд-во Ирк. гос. ун-та, 2006.- 48 с. (на русском языке)
http://bogard.isu.ru/books/ht_2006.pdf (2 Mb)
Автор
Отв: вычитка #4 (2009-II)
Народ, у меня есть архив библиотеки в текстовом формате (происхождение точно неизвестно, где то слил с какого-то сюдюка). В ней множество книг, думаю многие из них отсутствуют в библиотеки и представляют интерес. Но как уже говорил - недостаток, это обычный TXT (в koi-8). Я так понимаю тут много энтузиастов, готовых взяться за достойное оформление книг в FB2 (я к сожалению не распологаю достаточным временем и опытом для этого). Объем архива - около 10 гб в распакованном виде, 2 гб - в архиве RAR.
Вот тут - http://azlab.org/download/list.rar
лежит список ПАПОК присутствующих в архивах. Имена папок в основном - это фамилии авторов, внутри каждой папки куча TXT (в иных, десятки тысяч файлов). Если кого то интересует, маякните на почту или в личку, выложу на сайт (частями). Архивы - разбиты по буквам (то есть, в архиве "А" - авторы на букву "А")
Отв: вычитка #4 (2009-II)
мдя... у меня электронная библиотека около гигабайта - файлы в архивированном виде. Часть разобрана пофамильно. Читаю при помощи программы ice book reader - читает почти все (не сочтите за рекламу, пожалуйста). С кем делиться? :-)
Отв: вычитка #4 (2009-II)
Хотел взять на вычитку А.Розова "Чужая в чужом море", но файл http://lib.rus.ec/b/159006 8.08.2009 г. заменен на http://lib.rus.ec/b/160984. Как он по качеству? Может быть уже вычитан?
Ведь объем у него 4771К,а это немало... Если что-то из фантастики появится на вычитку, напишите в личку...
Отв: вычитка #4 (2009-II)
Прошу прощения, если обращаюсь не по адресу (где лучше спросить, в таком случае?).
Пробую сконвертировать книгу из pdf в fb2.
В pdf файле внизу каждой страницы - номер страницы и заголовок главы.
Есть ли способ автоматом их убрать в процессе конвертации или только вручную?
Отв: вычитка #4 (2009-II)
Есть. Настройте шаблоном размер "область распознавания текста" в FR таким образом, чтобы номер страницы и заголовок главы в эту область не попадали. Перед применением проверьте правильность "подхвата текста" на нескольких страницах из разный частей книги.
Если будете использовать что-то вроде abby pdf transformer - после сохранения в doc уберите нижний колонитул на всех страницах.
Отв: вычитка #4 (2009-II)
Спасибо!
Основная проблема была в том, что я не знал, что это называется колонтитулы. :)
В finereader нашёл даже опцию - сохранять без колонтитулов.
Отв: вычитка #4 (2009-II)
Начал вычитку книги Роулинг "Гарри Поттер и Дары смерти"
Отв: вычитка #4 (2009-II)
У Розова неправильно оформлен цикл "Конфедерация Меганезия" (http://lib.rus.ec/s/4494), перепутаны вторая и третья книги. То есть, "Созвездие Эректуса" - это вторая книга. Поправьте, пожалуйста, кто знает как. Я что-то не нашел, как можно править циклы...
Да, по поводу поста TaF. Я читаю "Чужую в чужом море" и по ходу - правлю. А что касается того, что их две - это надо связь разорвать, но я этого делать не рискну, лучше бы это сделал тот, кто исправлял или библиотекари...
Отв: вычитка #4 (2009-II)
А кто занимается вычиткой серии "Сто великих"? Могу я взять на вычитку "100 великих книг" http://lib.rus.ec/b/126346 ? Хочу прочитать книжку с пользой для общества :)
Отв: вычитка #4 (2009-II)
Конечно, берите. Только замените "требует вычитки" на "вычитывается". ;)
А можете после этого сконвертировать в fb2?
Страницы