Вы здесьХотим много книг, или сканировщики всех стран объединяйтесь!
Опубликовано пт, 04/12/2009 - 06:25 пользователем Lord KiRon
Последнее время озадачился вопросом попадания новых (да и старых) книг в сеть. Что мы имеем на данный момент? - Литресятину и разброд во всем остальном. Плюс еще последние события (вполне логично, однако все так же негативно) дробят наше сообщество сканировщиков и вычитывателей. В результате некоторые книги появляются и покупаются на разных сайтах по два-три раза некоторых совсем нет, люди делают лишнюю работу, за одно создавая потом лишние проблемы "библиотекарям". При всем уважении к Либрусеку, Флибусте, Песочнице , Huge-Library и многим другим я считаю что книги на первичную вычитку нужно брать в одном месте, и на данный момент таким наиболее подходящим местом явл;яется (в силу разных исторических причин) Библиотека Старого Чародея. Собственно речь о том что у них очень много книг, на "обработку" , даже больше чем людей и если вы можете помочь то загляните пожалуйста на главную http://oldmaglib.com/ справа или на форум http://bomanuar.com/forum/index.php?topic=231.0 и присмотрите себе книжку "в работу". За одно, если вы собираетесь купить какую то книжку, вначале проверьте на форуме http://bomanuar.com/forum/index.php?topic=231.0 - может она уже куплена , если вы купили какую то книгу то опять же пожалуйста отметьтесь там же чтобы не производить лишнюю ненужную работу. Да, и кстати , на Чародее применено очень удобное разделение труда - если вы например вычитываете но не имеете сканера и/или книг сканировать - то вы можете получить скан и вычитывать , если у вас есть сканер и книги а вы не имеете понятия как делать FB2 то вы можете отправить скан админу Старого Чародея и его сконвертирует и вычитает кто то другой. Короче, за работу товарищи ! :) Да, еще одна просьба, если вы не уверены что сможете сделать книгу в течении разумного периода времени (ну что то вроде месяца) то пожалуйста не беритесь за работу - этих книг ждут люди. Updated:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 1 день
miri.ness_ RE:Доступ 27 1 день bmusanov Оплатил, но абонемент не отображается 4 дня holla RE:Багрепорт - 2 5 дней sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 6 дней konst1 RE:Файнридер для Win11 1 неделя larin RE:Оплатил, но абонемент не отображается 1 неделя sem14 RE:Книжная серия «Сlio» издательства "Евразия" 1 неделя Isais RE:Национальный конкурс на лучшее литературное произведение... 1 неделя Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 неделя sem14 RE:Современная корейская литература. Книжная серия... 1 неделя sem14 RE:«Морской роман» — книжная серия Калининградского книжного... 1 неделя larin RE:Оплатил,но абонемент не отображается 2 недели sd RE:Fishing 2 недели Алексей111111111111 RE:Оплатила,но абонемент не отображается 2 недели kopak RE:Беженцы с Флибусты 3 недели Isais RE:Вадим Иванович Туманов - Всё потерять - и вновь начать с... 3 недели Isais RE:Семейственность в литературе 3 недели Впечатления о книгах
mysevra про Муравьева: Как воспитывали русского дворянина. Опыт знаменитых семей России – современным родителям (История, Педагогика)
09 08 Восхитительная книга. Нечто вроде «Лорд должен». Сейчас у нас таких людей уже не делают. Оценка: отлично!
mysevra про Нечуй-Левицкий: Кайдашева сім’я [uk] (Классическая проза)
09 08 Навіщо я його перечитала? Писав майстер, інакше мене б не трусило від злості та огиди. Мені вкрай не подобається історія і персонажі, але ж дійсно шедевр, оскільки одним із завдань літератури є змусити читача задуматися. Оценка: хорошо
mysevra про Чёрч: Во тьме безмолвной под холмом [litres] (Ужасы, Триллер)
09 08 Ну кто же не любит на ночь истории о старых недобрых богах? Живенько так, с фантазией. Оценка: отлично!
edik_m про Филипенко: Кремулятор (Современная проза)
09 08 Тяжелая книга. Вряд ли её можно рассматривать как достоверное историческое свидетельство, но моим представлениям о той эпохе она вполне соответствует. Оценка: хорошо
francuzik про Астахов: Император Пограничья 9 (Боевая фантастика, Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
08 08 Какая-то хрень. Картон и наивняк. Оценка: плохо
DGOBLEK про Чепижный: Гагаи. Том 1 (Советская классическая проза)
07 08 о людях донецкого села Крутой Яр ----------------------------------------- нету Крутого Ярауже ....русские с лица земли стерли(
dolle про Мусаниф: Другие грабли. Том 3 [СИ] (Альтернативная история, Боевик, Попаданцы, Самиздат, сетевая литература)
05 08 Можно прочесть вбоквелл физрука. Можно и не читать , ничего не потеряете. Оценка: хорошо
дядя_Андрей про Азимов: Я люблю маленькую киску (Юмористическая фантастика)
04 08 А почему "морально устаревший"? Вполне милый рассказец в духе раннего Марка Твена. Главному герою, конечно нужно посочувствовать. Но не меньшее сочувствие вызывает и Киска. А в целом вполне читабельно и вызывает улыбку. Оценка: отлично!
decim про Азимов: Я люблю маленькую киску (Юмористическая фантастика)
04 08 Необязательный рассказец, морально устаревший лет уж 50 назад. Оценка: плохо
obivatel про Волшебник
04 08 Читабельно, ненапряжно, завлекательно. Причин развала страны масса, не указано ни одной, это типичная "окопная правда". Ну и пусть: это не историческая работа, я "благие пожелания автора из его окопа", я не против. С учетом ………
DiSp про Лорд Системы
03 08 Хорошая серия. Любителям почитать, как герои-попаданцы с нуля налаживают быт, а потом развивают себя и общество до высот, о которых сперва и мечтать не могли - самое то. Слог хороший, юморной. И нет излишней жести и жестокости. ГГ удаётся остаться человеком.
udrees про Лей: Инвазия 3 (Боевая фантастика, Ужасы, Фантастика: прочее, Самиздат, сетевая литература)
03 08 Наверное это завершение трилогии про новых ксеноморфов. Вторая книга растянулась на две части. Вот в этой книге автор описывает продолжение борьбы с монстрами. Получается плохо, несмотря на все технические навороты, наличие ……… Оценка: неплохо |
Комментарии
Отв: Хотим много книг, или сканировщики всех стран ...
господа, если кто ещё не понял - я блондинка. вообще. от слова совсем.
1) расширение у отсканированного файла *tif
2) там есть такая кнопочка как "распознать текст".
3) после чего банально выделить мышкой и вставить в ворд. можно контрл с :)
компьютер собирала не я, софт кем только не устанавливался. если для этого самого копипэйста у меня что-то установлено - скажите где искать (пошагово).
если я не поняла тонкого юмора - простите, если я ввела невольно всех в заблуждение - тоже простите)
Отв: Хотим много книг, или сканировщики всех стран ...
Ясно.
Кнопочка "распознать текст" - только у программы OCR.
Главное работает, хоть и у блондинки.
Отв: Хотим много книг, или сканировщики всех стран ...
Если я спрошу что такое ORC это уже будет злоупотреблением святой невинностью и измывательством над профессионалами? честное слово - чувствую себя идиоткой, которая ещё и делает 20 движений, вместо одного.
Отв: Хотим много книг, или сканировщики всех стран ...
OCR переводится с буржуйского как "распознавание букв на картинках".
Отв: Хотим много книг, или сканировщики всех стран ...
OCR - это оптическое распознавание текста по аглицки )
Сканируете всю книгу в тифы например, потом все их открывате специальной программой для OCR - FineReader называется.
И в ней сразу все распознаете.
Если отсканировано более-менее хорошо (300 точек на дюйм) то ничего вручную набирать не придется. Тем более 30%, как Вы пишите.
Сканировать можно и сразу через файнридер, там остается только страницы листать, сканер сам сканирует все страницы подряд.
Отв: Хотим много книг, или сканировщики всех стран ...
Где в слове OCR вы увидели распознавание текста?
Отв: Хотим много книг, или сканировщики всех стран ...
*рассмеявшись* простите, все вопросы сняты. проще будет самой разобраться. если уж в основах единства мнений нет... и кто говорил что компьютерщики не гуманитарии?:))
Отв: Хотим много книг, или сканировщики всех стран ...
Optical Character Recognition
Отв: Хотим много книг, или сканировщики всех стран ...
Видимо, у блондинки установлен OCR-компонент MS Office (я серьезно, он там входит в полный комплект, но распознает, правда, хуже файнридера). Такой вариант, как достаточно экзотический, упоминался здесь на форуме в разделе soft.
Отв: Хотим много книг, или сканировщики всех стран ...
судя по всему - именно так. а может быть вы файнридером поделитесь? пыталась его найти пару месяцев назад - не вышло :(
Отв: Хотим много книг, или сканировщики всех стран ...
http://rapidlinks.ru/link/?lnk=29614
Отв: Хотим много книг, или сканировщики всех стран ...
А не подскажете, какие должны быть кавычки в книге? А то 3 разных вида получилось.
Отв: Хотим много книг, или сканировщики всех стран ...
Интересно также по поводу вложенных кавычек второй степени. Какие есть мнения?
Борис
Отв: Хотим много книг, или сканировщики всех стран ...
«» - кавычки первого уровня (Сочетание клавиш: Alt+0171 и Alt+00187 соответственно),
„“ - кавычки второго уровня (Сочетание клавиш: Alt+0132 и Alt+0147 соответственно).
Отв: Хотим много книг, или сканировщики всех стран ...
А вот если "третий вид" - это кавычки третьего уровня вложенности, то тоже ничего хорошего: поскольку в природе кавычки тройной вложенности практически не встречаются, то можно заподозрить парную потерю кавычек (например, в начале крупного фрагмента потерялась закрывающая кавычка или даже две, а в конце - открывающая).
Типовая причина - принятые в типографии правила расстановки сдвоенных кавычек, если используются кавычки только одного вида (ёлочки). Пример:
Операция "Золото" == «Операция „Золото“» == «Операция «Золото»» (неправильно) == «Операция «Золото» (правильно - одна закрывающая ёлочка вместо двух подряд).
Текст с такой расстановкой ёлочек нуждается в дообработке перед прогоном скрипта "кавычки на ёлочки" - надо найти все места, где под одиночной ёлочкой подразумевается двойная, и добавить недостающую кавычку. Признаком наличия таких мест может быть ненормально большое количество кавычек второго уровня (лапок) и/или наличие кавычек третьего уровня. Найти "урезанную" закрывающую ёлочку несложно - от открывающей лапки искать назад до закрывающей ёлочки. С урезанной открывающей ёлочкой чуть сложнее, но тоже можно, я просто навскидку не помню.
Отв: Хотим много книг, или сканировщики всех стран ...
Вообще-то, по-правильному нужно отличать кавычку (какой она направленности) по пробелу и прилепленности ее к слову, а потом уже считать пары. Но возможно компьютерный интеллект еще не готов.
Отв: Хотим много книг, или сканировщики всех стран ...
Скрипт в FBE отлично справляется с этим. "Ручная работа" нужна в считанных случаях.
Отв: Хотим много книг, или сканировщики всех стран ...
ах, спасибо!!! счастье есть и имя ему файнридер!!!! вычитала 20 страниц так, между делом! ох, чудо какое! спасибо огромное!
Отв: Хотим много книг, или сканировщики всех стран ...
И не думайте, что это счастье.
Теперь вы порабощены навеки...
:) :) :)
Отв: Хотим много книг, или сканировщики всех стран ...
спасибо за ссылку, полезностей много:) попытаюсь в свободное время разобраться...
Отв: Хотим много книг, или сканировщики всех стран ...
Посмотрите и здесь: http://publ.lib.ru/publib.html
Отв: Хотим много книг, или сканировщики всех стран ...
Уже писал свое мнение, повторюсь - на сегодняшний день считаю более пригодным для получения предварительного материала не сканер, а цифровой фотоаппарат (не менее 5 МПикс). Гораздо быстрее, а результат ничуть не хуже + книги не надо портить (особенно актуально для толстых и ветхих книг).
Отв: Хотим много книг, или сканировщики всех стран ...
Ребята, о чем спор? Просто сотрясание воздуха, а не разговор о сканировании. По моему надо просто сканировать. При использовании планшетного сканера, FR и некоторых специализированных программ выдача 600-страничной книги в формате Word занимает от 3 до 5 суток на русском или украинском языках. Надо СКАНИРОВАТЬ и ВЫЧИТЫВАТЬ, а не спорить о ни о чем.
Отв: Хотим много книг, или сканировщики всех стран ...
НАДО:) только, как было сказано выше, из-за того, что я не понимаю как оптимизировать процесс у меня несколько месяцев уходит на скан и вычитку 300 страниц. месяц - потому что комментарии вбитые мелким шрифтом только вручную и вбивать - не распознаются. а их много. но если есть возможность основной текст книги распознать по-человечески - поделитесь программой. тем же файнридером, о котором все говорят. но никто не дает. а классическую литературу вряд ли набежит толпа желающих вычитывать. потому и занимаюсь собственноручно.
Отв: Хотим много книг, или сканировщики всех стран ...
Киньте-ка мне пару страниц с комментариями на пробу, посмотрю, как файнридер справится с распознаванием. Залейте на ифолдер. А там, может, объединим усилия.
Отв: Хотим много книг, или сканировщики всех стран ...
большое спасибо за предложение, но файнридер их распознал (о, да! счастье есть!) так что скорость работы серьезно возросла (за 2 дня сделан тот объем работ, на который раньше уходила пару месяцев!!) :) так что спасибо, но лучше если вы потом это в fb2 переведете, этого я пока не умею:)
Отв: Хотим много книг, или сканировщики всех стран ...
Хорошо, сделайте rtf/doc и пришлите на почту библиотекарей.
Отв: Хотим много книг, или сканировщики всех стран ...
Проблема ,имхо, не в классичности литературы, а в том, что мы не умеем вычитывать. Мы - остальные блондинки и я вместе с ними. Как это "вычитывать"? Как вычитывать если нет бумажного экземпляра книги? Или я глупость какую спросила?
Отв: Хотим много книг, или сканировщики всех стран ...
Не совсем глупость :) мне без бумаги тоже гораздо тяжелей, но все же не смертельно , просто не люблю когда читаю перед компом сидеть а тут приходится. Хоть экран и 24" а все равно раздражает.
Отв: Хотим много книг, или сканировщики всех стран ...
А никак. Нет способа сделать качественную вычитку без оригинала. Правда, оригиналом вполне может служить дежавю вычитываемой книги. Не так удобно, но приемлимо.
Вот ведь какие загадочные существа блондинки. Кажется, глупость спросят, а подумаешь - совсем наоборот выходит...
Отв: Хотим много книг, или сканировщики всех стран ...
Тьфу-тьфу-тьфу! Пусть продукт жизнедеятельности выходит обычным путем. Совсем наоборот тоже не в радость получится ;)
У меня есть предложение к опытным товарищам: возьмите шефство над чайниками! Сканировщик вырастит сканировщика, спец по вычитке научит блондинку читать. Число участвующих и делающих работу на приемлемом уровне увеличится вдвое - спасем залежи неоцифрованых книг. Как там? Убил бобра - спас дерево. Хм, убил блондинку - спас вычитку...? Возьмите меня в подшефные! Я бестолковая совершенно, но очень терпеливая. Раз уж медведей учат ездить на велосипеде, то я могу научиться вычитывать. Может даже найдется кто из Украины, чтоб можно было запросто связаться по мобильному...
Отв: Хотим много книг, или сканировщики всех стран ...
Клевета на блондинок. Сегодня конвертила два любовных романа в fb2 из доков - идеальная вычитка OCR-а. Никакая чистка не нужна. Такую бы вычитку, да книгам других жанров... :)))
Отв: Хотим много книг, или сканировщики всех стран ...
А может это брюнетки, или, свят-свят, рыжие вычитывали? )))
Отв: Хотим много книг, или сканировщики всех стран ...
Не может этого быть!!! Скан, окр и вычитка - один и то же человек. )))
Отв: Хотим много книг, или сканировщики всех стран ...
Т.е. дама, умеющая "Скан, окр и вычитка" по определению не может быть брюнеткой или рыжей? )))
Ларисе респект в любом случае )
Отв: Хотим много книг, или сканировщики всех стран ...
Ларисе респект безусловно - очень качественная работа.
Отв: Хотим много книг, или сканировщики всех стран ...
И в бумажном издании бывают опечатки (а с 90х годов - очень даже часто). Такое тоже стоит поправлять, но осторожно.
Djvu, как и pdf, сделанный из djvu, иногда содержат глюки, особенно если закодировали книгу разрешением при 300dpi и менее. И не всегда эти глюки можно распознать. Некоторые буквы просто заменяются в нем другими, - похожими. Мне попадались даже попадались подмены-многозначности, когда по смыслу подходило и так, и эдак (смысл менялся, но логика повествования оставалась).
Отв: Хотим много книг, или сканировщики всех стран ...
Я предпочитаю FR7, хотя уже есть 9-й. А делится? Уж слишком он емкий.
Отв: Хотим много книг, или сканировщики всех стран ...
Все сканеры сейчас комплектуются программой распознавания IRIS. Это похуже FineReader, но тоже неплохо.
Очень быстрые сканеры без искажения у сгиба книги - Plustek (3 секунды на страницу). Книга раскрывается на 90 градусов (сканирование до сгиба, который приходится на край сканера). Такие сканеры немного дороже. Я, будучи админом в библиотеке, купил вот такой: http://www.plustek.com/product/book4600.asp для сканирования книг, а сейчас закупаю еще 4 штуки. Единственно что драйвер в комплекте был недоделанный, пришлось выкачивать свежий с сайта фирмы. Да, рекомендуется именно Plustek OpticBook 4600, то же самое модели 3600 по сети имеет плохие отзывы.
Отв: Хотим много книг, или сканировщики всех стран ...
У 4600 тоже хватает недостатков, особенно в софте и цветопередаче, но в принципе книжки сканировать - само то.
Да , кстати, он у вас тоже с последним драйвером стал после возврата (по окончании сканирования листа) "позиционироваться" (дергаться вперед-назад на сантиметра два)?
Отв: Хотим много книг, или сканировщики всех стран ...
я очень извеняюсь но всем спосибо узнал много адресов библиотек
сербезно СПОСИБО
Отв: Хотим много книг, или сканировщики всех стран ...
Скачайте словарь для начала.
Отв: Хотим много книг, или сканировщики всех стран ...
А Вы - FAQ по сетевой этике.
Отв: Хотим много книг, или сканировщики всех стран ...
Дайте ссылку. Пока что у меня есть только толстый-толстый FAQ по троллингу.
Отв: Хотим много книг, или сканировщики всех стран ...
Прямо научно-практическая конференция дояров.
Отв: Хотим много книг, или сканировщики всех стран ...
Не уж-то читали?
Всё под контролем, слава богу :)
Отв: Хотим много книг, или сканировщики всех стран ...
Да. прочитал. И тоже думаю что всё в порядке.
Искатели журналы сейчас сканирую. Никогда в таких масштабах этим не занимался, что-то тяжеловато с непривычки:(
Отв: Хотим много книг, или сканировщики всех стран ...
Распределяйте нагрузку. Не надрывайтесь. Вы нам нужны здоровый и веселый.
Отв: Хотим много книг, или сканировщики всех стран ...
Спасибо. Постараюсь:)
Отв: Хотим много книг, или сканировщики всех стран ...
Igorek67 : Выложите их (Искатели) в виде PDF(jpeg)/JPG/DjVu(лучшеphoto) или хоть обычном DjVu, пожалуйста!
Страницы