Нужна помощь в обработке

ВложениеРазмер
Иконка изображения zfmir.jpg22.61 КБ

Тема будет висеть в топе, пока работа не будет закончена. Обратите пож-ста на неё внимание. Сделайте остальным подарок к Новому Году.
Спасибо.






Практически все книги, вышедшие в серии "Зарубежная фантастика" издательства "Мир" с 1965 по 1999 года, в формате FB2!
http://rapidshare.com/files/174296402/Zarubegnaja_Fantastika_Mir.7z.001
http://rapidshare.com/files/174296403/Zarubegnaja_Fantastika_Mir.7z.002
Данные файлы представляют собой многотомный архив 7zip (www.7zip.org). Файлы подготовлены неплохо, проходят валидацию, но, конечно-же, не содержат всех fb2 "вкусностей", как те сборники, что успел подготовить я (см. на либрусеке "Пять зелёных лун", "Лалангамена" и "Братья по разуму" )

Файлов всего 131 (считаем, 128, три уже загружены).

Я предлагаю желающим помочь с обработкой файлов и выкладыванием обработанных книг на либрусек. Даешь полноценную серию "Мир"!

Что нужно делать с файлами (со всеми книгами): - добавить/заменить тег genre на sf - добавить серию: <sequence name="Зарубежная фантастика (изд-во Мир)"/> - разделить авторов и названия рассказов (сейчас они сверстаны в одну строку) - добавить всех авторов сборника в теги - добавить сноски (сейчас сноски находятся в тексте, разрывая его) - добавить дополнительную информацию о книгах, картинки. Брать можно вот отсюда: http://publ.lib.ru/ARCHIVES/Z/''Zarubejnaya_Fantastika''/_''ZF''.html

Как я предлагаю работать: - желающие присоединиться качают с рапиды полный архив; - выбирают себе по желанию год, книги за который они собираются обрабатывать; - сообщают об этом в этом топике (чтобы избежать дублирования работы) - выкладывают обработанные файлы на либрусек;

Думаю, что 30 человек вполне смогут качественно проделать эту работу в небольшой срок. Надеюсь, что на либрусеке найдутся 30 энтузиастов, владеющих FBE и желающих сделать подарок всем на Новый Год.

P.S. Не рекомендую замещать сборники "Пять зелёных лун", "Лалангамена" и "Братья по разуму" - они уже неплохо подготовлены.

Итого в обработке: - 1965 - 1966 - 1967 - 1968 - 1969 - 1970 - 1971 - 1972 - 1973 - 1974 - 1975 - 1976 - 1977 - 1978 ("Миры Клиффорда Саймака") - 1979 - 1980 - 1981 - 1982 - 1983 - 1984 - 1985 - 1986 - 1987 - 1988 - 1989 - 1990 - 1991 - 1992 - 1993 - 1994 - 1995 - 1996 - 1997 - 1999

Готовые книги здесь: Зарубежная фантастика (изд-во Мир)

1965
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
99

Комментарии

Я возьму 67-й и 68-й год. Буду делать в перерывах между OCR-ами сказок. Нет возражений?

Tanja45 написал:
Я возьму 67-й и 68-й год. Буду делать в перерывах между OCR-ами сказок. Нет возражений?

Я делаю 1967 год. Он, кстати, вычеркнут. ;)

Ладно-ладно. А 1968 - это тоже до меня, или уже про меня? Когда я выбирала - они не были отмечены.

Tanja45 написал:
Ладно-ладно. А 1968 - это тоже до меня, или уже про меня? Когда я выбирала - они не были отмечены.

Это я уже Вас отметила. :)

Взял 1970 год.

Кто-нибудь из библиотекарей, исправьте, пожалуйста, в сборнике "Путь марсиан" год, то бишь номер серии на 1966. А то я уже после заливки обнаружил свою ошибку.

МихалЫч написал:
исправьте, пожалуйста, в сборнике "Путь марсиан" год, то бишь номер серии на 1966.

Сделано.

Книга Р. Бредбери "Вино из одуванчиков" 1967 г. у меня есть в бумаге. Могу отсканировать - это и все, что я умею :(

psm написал:
Книга Р. Бредбери "Вино из одуванчиков" 1967 г. у меня есть в бумаге. Могу отсканировать - это и все, что я умею :(

Спасибо. Сборник из этой серии?

Да, конечно из этой.

Так сканировать? Если да, то где брать параметры для распознанного текста?

psm написал:
Да, конечно из этой.
Так сканировать? Если да, то где брать параметры для распознанного текста?

Я, к сожалению, в сканировании полный профан, поэтому не могу ответить на Ваши вопросы. :(
Но сканировать нужно. ;)

Некоторые небольшие хитрости, упрощающие форматирование книг после скана:

ФР грешит слиянием строк (абзацев) там, где не надо.

1) После распознавания текста в ФР, до передачи его в ворд, встаем на самый первый текстовый блок, жмем поиск, галочку "искать по всему документу" ставим.
2) Делаем поиском дефис + разрыв строки - автоматом меняем на мягкий перенос + разрыв строки
3) восклицательный знак + разрыв строки - тыкаем в текст и ставим энтер где надо.
4) вопросительный знак + разрыв строки - тыкаем в текст и ставим энтер где надо.
5) двоеточие + разрыв строки - тыкаем в текст и ставим энтер где надо.
6) точка + разрыв строки - тыкаем в текст и ставим энтер где надо.

Я к тому, что в Библиотеке Старого Чародея есть четкие "Рекомендации помощникам по форматированию вычитанных книг" (http://www.oldmaglib.com/help/assistent.php)

У нас :) есть такие? Я-то в Worde отформатирую как угодно, но как угодно для того, кто будет делать fb2? :)

psm написал:
Я к тому, что в Библиотеке Старого Чародея есть четкие "Рекомендации помощникам по форматированию вычитанных книг" (http://www.oldmaglib.com/help/assistent.php)
У нас :) есть такие? Я-то в Worde отформатирую как угодно, но как угодно для того, кто будет делать fb2? :)

Выделить заголовки, подзаголовки, стихи.
Сноски сделать в квадратных (фигурных) скобках.
А больше особых пожеланий, вроде, нет. Мы не капризные. ;)

И ещё раз спасибо.

Заголовки по центру хотя бы расставить )

SeNS написал:

- добавить дополнительную информацию о книгах, картинки. Брать можно вот отсюда: http://publ.lib.ru/ARCHIVES/Z/''Zarubejnaya_Fantastika''/_''ZF''.html

Наткнулся вот здесь http://www.bibliograph.ru/Antology/MIR/m1.html на еще одну сводку этой серии.
Может быть и первоисточник, так как картинки вроде крупнее. Однако в чем-то полнее publ.lib.ru.
И вообще сайт http://www.bibliograph.ru нехилый.

PS Но вводные статьи тоже отсутствуют :( Но кое где есть! :)
PPS Просьба еще к SeNS или golma1 - добавить в головной пост ссылочку на страницу сборников http://lib.rus.ec/s/5103 для облегчения проверки выложенного.

Вай, спасибо!
И еще, раз кто-то живой есть, добавьте в список 1988 год. Я его еще не полностью сделал.
К SeNS - а Вы из какого года сборник "Лалангамена" делали? В 1988 2-е издание его вышло (первое в 85-м), вроде бы стереотипное, так что я его пропущу.

Вроде бы закончил 1988 год.
Запишите за мной 1991 год. Одна из книг у меня есть живьем, к тому же.

И все же. Как быть с романами, которые уже есть на Либрусеке и числятся за соответствующими авторами, если в "Мир"овской книжке только один этот роман? Нпрмр: 89 год Шоу, 77 год Комацу и т.д.

oldvagrant написал:

И все же. Как быть с романами, которые уже есть на Либрусеке и числятся за соответствующими авторами, если в "Мир"овской книжке только один этот роман? Нпрмр: 89 год Шоу, 77 год Комацу и т.д.

Решили отложить. Дабы не вводить в заблуждение мнимым наличием.

Вот один из сборников уже нашёлся. psm отсканирует полностью, буду делать.
Думаю, что это оптимальный вариант.

Я делал по второму изданию, из DOC-файлов, вот отсюда: http://publ.lib.ru/ARCHIVES/Z/''Zarubejnaya_Fantastika''/_''ZF''.html#8801

oldvagrant написал:
SeNS написал:

- добавить дополнительную информацию о книгах, картинки. Брать можно вот отсюда: http://publ.lib.ru/ARCHIVES/Z/''Zarubejnaya_Fantastika''/_''ZF''.html

Наткнулся вот здесь http://www.bibliograph.ru/Antology/MIR/m1.html на еще одну сводку этой серии.
Может быть и первоисточник, так как картинки вроде крупнее. Однако в чем-то полнее publ.lib.ru.
И вообще сайт http://www.bibliograph.ru нехилый.
PS Но вводные статьи тоже отсутствуют :( Но кое где есть! :)

Полная профессиональная библиография серии ЗФ с обложками - http://bibliography.ufacom.ru/sub/1/zf.php

golma1 написал:
Решили отложить. Дабы не вводить в заблуждение мнимым наличием.

Бр-р-р. Не понял.
Я имею ввиду, что книжка "сборника" из серии содержит только одно произведение, т.к. это большой роман. И это произведение уже выложено у соответствующего автора (это же не сборник реально).
Я писал тут раньше, что файл Комацу "Гибель дракона" (целиком занимающая книжку ЗФ 1977) лежит у самого Комацу в том же виде, как в архиве, который мы скачали.
Как быть с такими книжками? Есть ли смысл их дублировать (и можно ли вообще) в серии?

Попробую пояснить свою мысль.

В сборник Брэдбери "Вино из одуванчиков" входили, помимо самого романа, еще рассказы и повести. В исходном же файле был только роман.
Договорились его не выкладывать (тем более, что он есть отдельной книгой). Иначе создастся впечатление, что книга из серии присутствует, хотя, на самом деле, в ней не хватает остальных произведений. Теперь я жду скана этой книги (полностью - роман и рассказы/повести).

Только что подумала, что, возможно, Вы имеете в виду другой случай: когда в "сборнике" изначально присутствует только одно произведение. Здесь я бы сделала отдельную книгу, пометив её серией "Зарубежная фантастика (изд-во Мир)", чтобы серия была представлена полностью. И обязательно бы заблокировала от объединения с другим экземпляром книги.

Цель нашей акции - собрать серию в полном составе. Или?
Надеюсь, что мне удалось более-менее связно изложить свои мысли. ;)

Цитата:
Надеюсь, что мне удалось более-менее связно изложить свои мысли. ;)

Теперь да ;)
Принцип понятен. А такова ли была идея, я тоже не знаю.
И как заблокировать - я не знаю тоже (для разнообразия:)

И ышшо! А если книжка переиздана в том же виде, что делать? (Я опять же упоминал один пример "Лалангамена" - этот сборник издан в 85 и в 88 году (изд. 2е стереотипное)). Тут уж дублировать смысла нет совсем. Как ее ловчее представить?

Если книга вышла в том-же виде, что и первоначальное издание - я полагаю имеет смысл добавить информацию о книге. Если издание и перевод другие - тогда имеет смысл выкладывать обе книги. Переводы разные - на вкус и цвет не спорят. Хотя книги этого периода - отличались хорошим переводом.

Кто будет делать 71 год - пропускайте "Фантастические изобретения". Я их сейчас делаю для переиздания 91 года, заодно сделаю и для 71го.

В сборниках за 1968 год - и в Fb2 и в тех исходниках, которые есть в библиотеке Ершова - иллюстрации отсутствуют. Если у кого есть они на бумаге, и если есть возможность - сосканьте их, пожалуйста.
1968:
* Гости страны Фантазии. (1968) Антология
* Каттнер Г. Робот-зазнайка. (1968)
* Пиршество демонов. (1968) Антология
* Саймак К. Все живое... (1968) Авт. сборник
* Случай Ковальского. (1968) Антология
* Человек, который ищет. (1968) Антология
* 31 июня. (1968) Антология

Опять я :)
Я сканирую Бредбери. Боюсь, вычитка займет пару дней, поэтому запрошу инструкции сейчас - а что мне дальше делать с файлом, куда его грузить?

И еще. Насколько я понял, роман, выложенный в библиотеке, отличается от "сборника" ЗФ тем, что в "сборнике" обязательно есть вступительная статья. Например, я проверил С.Комацу (http://lib.rus.ec/b/66867) - там чистый роман, а в "сборнике" еще есть статья Е.Парнова "Жестокий эксперимент" на 13 стр.

psm написал:
И еще. Насколько я понял, роман, выложенный в библиотеке, отличается от "сборника" ЗФ тем, что в "сборнике" обязательно есть вступительная статья. Например, я проверил С.Комацу (http://lib.rus.ec/b/66867) - там чистый роман, а в "сборнике" еще есть статья Е.Парнова "Жестокий эксперимент" на 13 стр.

(меланхолично) Аххха. Только статей в большинстве случаев нету. Нету и у Комацу.

PS Поправка. Статья Парнова нашлась в конце файла.

>куда его грузить?
Так как его переделуют в fb2 и выложат, то грузить в библиотеку не стоит.
1. закинуть на файлообменник и дать ссылку.
или
2. послать по почте на bibliotekar.librusec_ -_gmail.com

У меня есть ;)

Нигде не нашла фамилий переводчиков к этим сборникам.
* Каттнер Г. Робот-зазнайка. (1968)
* Саймак К. Все живое... (1968) Авт. сборник
Если у кого есть инфа к ним, может поделитесь? А?

Уй! Как стыдно! Поторопилась! Нора Галь же и еще найду,а вот : Н. Евдокимова.

Я вот не пойму, а нельзя было что ли залить 40 МБ одним архивом? тем более что это один архив разбитый на два. На Рапиде приходиться ждать после каждого архива..
Ну чем думал автор?

Я не понял что это означает?
:

Цитата:
- добавить всех авторов сборника в теги

В какие именно теги?

Взял 1969 год

А что непонятно? Прописать всех авторов в description. Весьма желательно проверить Фамилию/Имя/Отчество по тем, что уже есть в библе, чтобы не плодить дублей.

Непорядок!
Библиотекарям: пропишите номер (год) книгам "Дьявольское оружие", "Лалангамена (сборник)" и "Пять зелёных лун (сборник)", а то выбиваются из стройной картины :)
Сам делаю последнюю из 1996, Чапека. Там мрачно... Около 200 сносок, сваленных абы-как, безо всяких скобок в конце произведения.. Ну да ладно, осилим :)

Нук гляньте кто нибудь, так чтоли делать?
http://lib.rus.ec/b/133074

Он выбежал из холла, порылся в карманах пальто. * По-венгерски «мишура» дословно означает "волосы ангела". — Прим. перев.

Сноски оформить ))

Звездолет на Галахор

"…Когда люди достигли границ солнечной системы ...........
........... И вот первые пассажирские корабли отправились в путь…"

(Из "Учебника галактической истории", гл.

II, стр. 175, издание Таксиурского универси тета, 4961 год.)

Такие штуки - цитатами.

TaKir написал:
Он выбежал из холла, порылся в карманах пальто. * По-венгерски «мишура» дословно означает "волосы ангела". — Прим. перев.

Сноски оформить ))

Некоторые сноски утеряны.
"J'y suis, j'y reste"…* - нет обозначения. Втч в doc варианте.
Я их пропущу.

Вообще, нормально, но я бы еще прошелся скриптом "кавычки на ёлочки". И формат желательно utf-8.
Upd. О, TaKir еще неоформленные сноски нашел. Так что можно еще подправить :)

МихалЫч написал:
Вообще, нормально, но я бы еще прошелся скриптом "кавычки на ёлочки". И формат желательно utf-8.
Upd. О, TaKir еще неоформленные сноски нашел. Так что можно еще подправить :)

Там одна сноска неоформлена.

Как работать с этим скриптом (кавычки?)
Как перевести в utf?

Psychedelic написал:
Как перевести в utf?

В FBE в Меню/Сохранить как...
В открывшейся вкладке самая нижняя строка

Цитата:
Как работать с этим скриптом (кавычки?)

Хм, странный вопрос. Запустить :)
А если серьезно, Скрипты -> Чистка -> Кавычки на ёлочки. Если появится сообщение о кавычках третьего уровня, я обычно останавливаю, и разбираюсь. Как правило, в этом случае в тексте где-то пропущена закрывающая кавычка. Или может быть случай, когда встречается закрывающая кавычка без открывающей - скрипт тоже об этом предупреждает - это практически 100% ошибка OCR.

"Охота на Сэтавра" - кто сделал, впишите, пожалуйста, сами в сорцах год издания, и его же в номер серии. Я не знаю, поэтому и не поправила :(

Это похоже, дубль. Хотя, утверждать не возьмусь..

Tanja45 написал:
"Охота на Сэтавра" - кто сделал, впишите, пожалуйста, сами в сорцах год издания, и его же в номер серии. Я не знаю, поэтому и не поправила :(

Поправил. Также нашел недостающее предисловие.
Объединил.
http://lib.rus.ec/b/133414

TaKir написал:
Поправил. Также нашел недостающее предисловие.
Объединил.
http://lib.rus.ec/b/133414

Здорово!
А недостающие предисловия в своей порции мне даже пришлось окрить, а недостающуюю выходную инфу собирать по всему инету. Чуть не сутки напролет. :))

Охота на Сэтавра - это, похоже, сборник "Навигатор Пиркс. Голос Неба." Лема. 1971 год.

http://publ.lib.ru/ARCHIVES/Z/%27%27Zarubejnaya_Fantastika%27%27/_%27%27ZF%27%27.html#7005

Да, но есть еще и авторский сборник "Охота на Сэтавра" 1965 года. Который это из них, пока трудно сказать..
Если это дубль, то надо объединить с этой.

Друзья! Я недавно делал "ННЕДЕТСКИЕ ИГРЫ" Зарубежная фантастка "МИР". Перекиньте, если не трудно к себе.

Страницы

X