Вы здесьХотим много книг, или сканировщики всех стран объединяйтесь!
Опубликовано пт, 04/12/2009 - 06:25 пользователем Lord KiRon
Последнее время озадачился вопросом попадания новых (да и старых) книг в сеть. Что мы имеем на данный момент? - Литресятину и разброд во всем остальном. Плюс еще последние события (вполне логично, однако все так же негативно) дробят наше сообщество сканировщиков и вычитывателей. В результате некоторые книги появляются и покупаются на разных сайтах по два-три раза некоторых совсем нет, люди делают лишнюю работу, за одно создавая потом лишние проблемы "библиотекарям". При всем уважении к Либрусеку, Флибусте, Песочнице , Huge-Library и многим другим я считаю что книги на первичную вычитку нужно брать в одном месте, и на данный момент таким наиболее подходящим местом явл;яется (в силу разных исторических причин) Библиотека Старого Чародея. Собственно речь о том что у них очень много книг, на "обработку" , даже больше чем людей и если вы можете помочь то загляните пожалуйста на главную http://oldmaglib.com/ справа или на форум http://bomanuar.com/forum/index.php?topic=231.0 и присмотрите себе книжку "в работу". За одно, если вы собираетесь купить какую то книжку, вначале проверьте на форуме http://bomanuar.com/forum/index.php?topic=231.0 - может она уже куплена , если вы купили какую то книгу то опять же пожалуйста отметьтесь там же чтобы не производить лишнюю ненужную работу. Да, и кстати , на Чародее применено очень удобное разделение труда - если вы например вычитываете но не имеете сканера и/или книг сканировать - то вы можете получить скан и вычитывать , если у вас есть сканер и книги а вы не имеете понятия как делать FB2 то вы можете отправить скан админу Старого Чародея и его сконвертирует и вычитает кто то другой. Короче, за работу товарищи ! :) Да, еще одна просьба, если вы не уверены что сможете сделать книгу в течении разумного периода времени (ну что то вроде месяца) то пожалуйста не беритесь за работу - этих книг ждут люди. Updated:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 18 часов
lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 23 часа Larisa_F RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 день mig2009 RE:Багрепорт - 2 4 дня Isais RE:Издательство "Медуза" 5 дней babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Kiesza RE:Бушков умер. 2 недели sibkron RE:Серия "Библиотека французской литературы" (Макбел) 2 недели Isais RE:Игорь Северянин - Том 2. Поэзоантракт 3 недели sem14 RE:Современная корейская литература. Книжная серия... 3 недели sem14 RE:Семейственность в литературе 3 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц kopak RE:На 78-м году жизни скончался советский и российский... 1 месяц Саша из Киева RE:Подводное течение 1 месяц konst1 RE:Переименовать ник (имя учетки) 1 месяц Larisa_F RE:Таррин Фишер 2 месяца Aleks_Sim RE:Беженцы с Флибусты 2 месяца Впечатления о книгах
Олег Макаров. про Путилов: Опасные манипуляции [СИ] (Детективная фантастика, Городское фэнтези, Самиздат, сетевая литература)
23 10 Мастерское затягивание текста. Ничего не происходит, но вот-вот произойдет. 5,66% и я сломался. Так писать нельзя Оценка: нечитаемо
дядя_Андрей про Каратист
23 10 Какие-то однообразно у ГГ всё получается. Что в каратэ, что с девушками. И, на мой взгляд, произведение излишне перегружено специфической терминологией. Ладно, мне она знакома, а вот неподготовленный читатель может и завязнуть.
Анни-Мари про Панарин: Эволюционер из трущоб (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
21 10 Мдя. Я все понимаю, взрослое сознание в теле младенца и вот это все, но физиологию куда дели?! Младенец, которому нет еще месяца, умудряется встать на ноги и стоять! О_о Автор детей новорожденных видел хоть раз? Хотя бы на картинке?
mysevra про Стругацкие: Обитаемый остров (Вариант 1971 года) (Космическая фантастика)
20 10 Одновременно и восхитительно, и запредельно бесчеловечно. Пробирает. Великолепная книга, которая читается взахлёб. Оценка: отлично!
mysevra про Дочинец: Многії літа. Благії літа [uk] (Современная проза)
20 10 Так гарно, душевно та мудро. Доки не згадується втеча, описана у інший книзі – «В’язень замку Паланок». Тоді вже всі слова автора сприймаються як лицемірство. Оценка: неплохо
mysevra про Лазарев: Кочевница (Боевая фантастика)
20 10 Мир далёк от канона, и события не такие уж яркие. Опять же, текст не правлен стилистически - тавтология почти на каждой странице. В принципе, история хороша, изложить бы её красиво. Продолжение читать желания нет, но отдельное «спасибо» за идею. Оценка: хорошо
mig2009 про Мур: Дурак [Fool ru] (Юмористическая проза)
20 10 Этакая интерпретация-пародия-видение автора (шута) на известную трагедию. Корделию он не умертвил, а так, в целом все по канве. Зашел глянуть, не появилась ли третья книга (в смысле перевод) из цикла, в 2020 издана, Shakespeare for Squirrels. Ан нет( Оценка: хорошо
Stager про Бохэннон: ЕВА. История эволюции женского тела. История человечества [litres] (История, Биология, Научпоп)
20 10 Почему американцы такие тупые? Оценка: нечитаемо
Oleg68 про Кобен: Скованные одной цепью [Live Wire ru] (Крутой детектив)
19 10 Как всегда-отлично. Это последняя книга в серии о Майроне Болитаре? Оценка: отлично!
Олег Макаров. про Путилов: Постовой [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
18 10 Феерически безграмотный текст. Просто невозможно читать Оценка: нечитаемо
lukyanelena про Сергей Васильевич Лукьяненко
18 10 Фантастический писатель Лукьяненко. Вроде и книги пишет с моралью, и метания главного героя всегда правильные высокоморальные... но как же бесит этот русский шовинизм, лезущий из всех щелей, просто ужас. И Украину обязательно ………
mixentiy про Ильичев: Ворожей Горин: зов крови [СИ] (Городское фэнтези, Мистика, Самиздат, сетевая литература)
18 10 Многословно. Тот случай, когда диалоги и размышлизмы должны быть проще. Забавненько. Немного утомляют медицинские познания автора, вываливаемые на читателя к месту и совсем не. Но "специалист подобен флюсу" - суть ……… |
Комментарии
Отв: Хотим много книг, или сканировщики всех стран ...
господа, если кто ещё не понял - я блондинка. вообще. от слова совсем.
1) расширение у отсканированного файла *tif
2) там есть такая кнопочка как "распознать текст".
3) после чего банально выделить мышкой и вставить в ворд. можно контрл с :)
компьютер собирала не я, софт кем только не устанавливался. если для этого самого копипэйста у меня что-то установлено - скажите где искать (пошагово).
если я не поняла тонкого юмора - простите, если я ввела невольно всех в заблуждение - тоже простите)
Отв: Хотим много книг, или сканировщики всех стран ...
Ясно.
Кнопочка "распознать текст" - только у программы OCR.
Главное работает, хоть и у блондинки.
Отв: Хотим много книг, или сканировщики всех стран ...
Если я спрошу что такое ORC это уже будет злоупотреблением святой невинностью и измывательством над профессионалами? честное слово - чувствую себя идиоткой, которая ещё и делает 20 движений, вместо одного.
Отв: Хотим много книг, или сканировщики всех стран ...
OCR переводится с буржуйского как "распознавание букв на картинках".
Отв: Хотим много книг, или сканировщики всех стран ...
OCR - это оптическое распознавание текста по аглицки )
Сканируете всю книгу в тифы например, потом все их открывате специальной программой для OCR - FineReader называется.
И в ней сразу все распознаете.
Если отсканировано более-менее хорошо (300 точек на дюйм) то ничего вручную набирать не придется. Тем более 30%, как Вы пишите.
Сканировать можно и сразу через файнридер, там остается только страницы листать, сканер сам сканирует все страницы подряд.
Отв: Хотим много книг, или сканировщики всех стран ...
Где в слове OCR вы увидели распознавание текста?
Отв: Хотим много книг, или сканировщики всех стран ...
*рассмеявшись* простите, все вопросы сняты. проще будет самой разобраться. если уж в основах единства мнений нет... и кто говорил что компьютерщики не гуманитарии?:))
Отв: Хотим много книг, или сканировщики всех стран ...
Optical Character Recognition
Отв: Хотим много книг, или сканировщики всех стран ...
Видимо, у блондинки установлен OCR-компонент MS Office (я серьезно, он там входит в полный комплект, но распознает, правда, хуже файнридера). Такой вариант, как достаточно экзотический, упоминался здесь на форуме в разделе soft.
Отв: Хотим много книг, или сканировщики всех стран ...
судя по всему - именно так. а может быть вы файнридером поделитесь? пыталась его найти пару месяцев назад - не вышло :(
Отв: Хотим много книг, или сканировщики всех стран ...
http://rapidlinks.ru/link/?lnk=29614
Отв: Хотим много книг, или сканировщики всех стран ...
А не подскажете, какие должны быть кавычки в книге? А то 3 разных вида получилось.
Отв: Хотим много книг, или сканировщики всех стран ...
Интересно также по поводу вложенных кавычек второй степени. Какие есть мнения?
Борис
Отв: Хотим много книг, или сканировщики всех стран ...
«» - кавычки первого уровня (Сочетание клавиш: Alt+0171 и Alt+00187 соответственно),
„“ - кавычки второго уровня (Сочетание клавиш: Alt+0132 и Alt+0147 соответственно).
Отв: Хотим много книг, или сканировщики всех стран ...
А вот если "третий вид" - это кавычки третьего уровня вложенности, то тоже ничего хорошего: поскольку в природе кавычки тройной вложенности практически не встречаются, то можно заподозрить парную потерю кавычек (например, в начале крупного фрагмента потерялась закрывающая кавычка или даже две, а в конце - открывающая).
Типовая причина - принятые в типографии правила расстановки сдвоенных кавычек, если используются кавычки только одного вида (ёлочки). Пример:
Операция "Золото" == «Операция „Золото“» == «Операция «Золото»» (неправильно) == «Операция «Золото» (правильно - одна закрывающая ёлочка вместо двух подряд).
Текст с такой расстановкой ёлочек нуждается в дообработке перед прогоном скрипта "кавычки на ёлочки" - надо найти все места, где под одиночной ёлочкой подразумевается двойная, и добавить недостающую кавычку. Признаком наличия таких мест может быть ненормально большое количество кавычек второго уровня (лапок) и/или наличие кавычек третьего уровня. Найти "урезанную" закрывающую ёлочку несложно - от открывающей лапки искать назад до закрывающей ёлочки. С урезанной открывающей ёлочкой чуть сложнее, но тоже можно, я просто навскидку не помню.
Отв: Хотим много книг, или сканировщики всех стран ...
Вообще-то, по-правильному нужно отличать кавычку (какой она направленности) по пробелу и прилепленности ее к слову, а потом уже считать пары. Но возможно компьютерный интеллект еще не готов.
Отв: Хотим много книг, или сканировщики всех стран ...
Скрипт в FBE отлично справляется с этим. "Ручная работа" нужна в считанных случаях.
Отв: Хотим много книг, или сканировщики всех стран ...
ах, спасибо!!! счастье есть и имя ему файнридер!!!! вычитала 20 страниц так, между делом! ох, чудо какое! спасибо огромное!
Отв: Хотим много книг, или сканировщики всех стран ...
И не думайте, что это счастье.
Теперь вы порабощены навеки...
:) :) :)
Отв: Хотим много книг, или сканировщики всех стран ...
спасибо за ссылку, полезностей много:) попытаюсь в свободное время разобраться...
Отв: Хотим много книг, или сканировщики всех стран ...
Посмотрите и здесь: http://publ.lib.ru/publib.html
Отв: Хотим много книг, или сканировщики всех стран ...
Уже писал свое мнение, повторюсь - на сегодняшний день считаю более пригодным для получения предварительного материала не сканер, а цифровой фотоаппарат (не менее 5 МПикс). Гораздо быстрее, а результат ничуть не хуже + книги не надо портить (особенно актуально для толстых и ветхих книг).
Отв: Хотим много книг, или сканировщики всех стран ...
Ребята, о чем спор? Просто сотрясание воздуха, а не разговор о сканировании. По моему надо просто сканировать. При использовании планшетного сканера, FR и некоторых специализированных программ выдача 600-страничной книги в формате Word занимает от 3 до 5 суток на русском или украинском языках. Надо СКАНИРОВАТЬ и ВЫЧИТЫВАТЬ, а не спорить о ни о чем.
Отв: Хотим много книг, или сканировщики всех стран ...
НАДО:) только, как было сказано выше, из-за того, что я не понимаю как оптимизировать процесс у меня несколько месяцев уходит на скан и вычитку 300 страниц. месяц - потому что комментарии вбитые мелким шрифтом только вручную и вбивать - не распознаются. а их много. но если есть возможность основной текст книги распознать по-человечески - поделитесь программой. тем же файнридером, о котором все говорят. но никто не дает. а классическую литературу вряд ли набежит толпа желающих вычитывать. потому и занимаюсь собственноручно.
Отв: Хотим много книг, или сканировщики всех стран ...
Киньте-ка мне пару страниц с комментариями на пробу, посмотрю, как файнридер справится с распознаванием. Залейте на ифолдер. А там, может, объединим усилия.
Отв: Хотим много книг, или сканировщики всех стран ...
большое спасибо за предложение, но файнридер их распознал (о, да! счастье есть!) так что скорость работы серьезно возросла (за 2 дня сделан тот объем работ, на который раньше уходила пару месяцев!!) :) так что спасибо, но лучше если вы потом это в fb2 переведете, этого я пока не умею:)
Отв: Хотим много книг, или сканировщики всех стран ...
Хорошо, сделайте rtf/doc и пришлите на почту библиотекарей.
Отв: Хотим много книг, или сканировщики всех стран ...
Проблема ,имхо, не в классичности литературы, а в том, что мы не умеем вычитывать. Мы - остальные блондинки и я вместе с ними. Как это "вычитывать"? Как вычитывать если нет бумажного экземпляра книги? Или я глупость какую спросила?
Отв: Хотим много книг, или сканировщики всех стран ...
Не совсем глупость :) мне без бумаги тоже гораздо тяжелей, но все же не смертельно , просто не люблю когда читаю перед компом сидеть а тут приходится. Хоть экран и 24" а все равно раздражает.
Отв: Хотим много книг, или сканировщики всех стран ...
А никак. Нет способа сделать качественную вычитку без оригинала. Правда, оригиналом вполне может служить дежавю вычитываемой книги. Не так удобно, но приемлимо.
Вот ведь какие загадочные существа блондинки. Кажется, глупость спросят, а подумаешь - совсем наоборот выходит...
Отв: Хотим много книг, или сканировщики всех стран ...
Тьфу-тьфу-тьфу! Пусть продукт жизнедеятельности выходит обычным путем. Совсем наоборот тоже не в радость получится ;)
У меня есть предложение к опытным товарищам: возьмите шефство над чайниками! Сканировщик вырастит сканировщика, спец по вычитке научит блондинку читать. Число участвующих и делающих работу на приемлемом уровне увеличится вдвое - спасем залежи неоцифрованых книг. Как там? Убил бобра - спас дерево. Хм, убил блондинку - спас вычитку...? Возьмите меня в подшефные! Я бестолковая совершенно, но очень терпеливая. Раз уж медведей учат ездить на велосипеде, то я могу научиться вычитывать. Может даже найдется кто из Украины, чтоб можно было запросто связаться по мобильному...
Отв: Хотим много книг, или сканировщики всех стран ...
Клевета на блондинок. Сегодня конвертила два любовных романа в fb2 из доков - идеальная вычитка OCR-а. Никакая чистка не нужна. Такую бы вычитку, да книгам других жанров... :)))
Отв: Хотим много книг, или сканировщики всех стран ...
А может это брюнетки, или, свят-свят, рыжие вычитывали? )))
Отв: Хотим много книг, или сканировщики всех стран ...
Не может этого быть!!! Скан, окр и вычитка - один и то же человек. )))
Отв: Хотим много книг, или сканировщики всех стран ...
Т.е. дама, умеющая "Скан, окр и вычитка" по определению не может быть брюнеткой или рыжей? )))
Ларисе респект в любом случае )
Отв: Хотим много книг, или сканировщики всех стран ...
Ларисе респект безусловно - очень качественная работа.
Отв: Хотим много книг, или сканировщики всех стран ...
И в бумажном издании бывают опечатки (а с 90х годов - очень даже часто). Такое тоже стоит поправлять, но осторожно.
Djvu, как и pdf, сделанный из djvu, иногда содержат глюки, особенно если закодировали книгу разрешением при 300dpi и менее. И не всегда эти глюки можно распознать. Некоторые буквы просто заменяются в нем другими, - похожими. Мне попадались даже попадались подмены-многозначности, когда по смыслу подходило и так, и эдак (смысл менялся, но логика повествования оставалась).
Отв: Хотим много книг, или сканировщики всех стран ...
Я предпочитаю FR7, хотя уже есть 9-й. А делится? Уж слишком он емкий.
Отв: Хотим много книг, или сканировщики всех стран ...
Все сканеры сейчас комплектуются программой распознавания IRIS. Это похуже FineReader, но тоже неплохо.
Очень быстрые сканеры без искажения у сгиба книги - Plustek (3 секунды на страницу). Книга раскрывается на 90 градусов (сканирование до сгиба, который приходится на край сканера). Такие сканеры немного дороже. Я, будучи админом в библиотеке, купил вот такой: http://www.plustek.com/product/book4600.asp для сканирования книг, а сейчас закупаю еще 4 штуки. Единственно что драйвер в комплекте был недоделанный, пришлось выкачивать свежий с сайта фирмы. Да, рекомендуется именно Plustek OpticBook 4600, то же самое модели 3600 по сети имеет плохие отзывы.
Отв: Хотим много книг, или сканировщики всех стран ...
У 4600 тоже хватает недостатков, особенно в софте и цветопередаче, но в принципе книжки сканировать - само то.
Да , кстати, он у вас тоже с последним драйвером стал после возврата (по окончании сканирования листа) "позиционироваться" (дергаться вперед-назад на сантиметра два)?
Отв: Хотим много книг, или сканировщики всех стран ...
я очень извеняюсь но всем спосибо узнал много адресов библиотек
сербезно СПОСИБО
Отв: Хотим много книг, или сканировщики всех стран ...
Скачайте словарь для начала.
Отв: Хотим много книг, или сканировщики всех стран ...
А Вы - FAQ по сетевой этике.
Отв: Хотим много книг, или сканировщики всех стран ...
Дайте ссылку. Пока что у меня есть только толстый-толстый FAQ по троллингу.
Отв: Хотим много книг, или сканировщики всех стран ...
Прямо научно-практическая конференция дояров.
Отв: Хотим много книг, или сканировщики всех стран ...
Не уж-то читали?
Всё под контролем, слава богу :)
Отв: Хотим много книг, или сканировщики всех стран ...
Да. прочитал. И тоже думаю что всё в порядке.
Искатели журналы сейчас сканирую. Никогда в таких масштабах этим не занимался, что-то тяжеловато с непривычки:(
Отв: Хотим много книг, или сканировщики всех стран ...
Распределяйте нагрузку. Не надрывайтесь. Вы нам нужны здоровый и веселый.
Отв: Хотим много книг, или сканировщики всех стран ...
Спасибо. Постараюсь:)
Отв: Хотим много книг, или сканировщики всех стран ...
Igorek67 : Выложите их (Искатели) в виде PDF(jpeg)/JPG/DjVu(лучшеphoto) или хоть обычном DjVu, пожалуйста!
Страницы