Вы здесьВалидация fb2
Опубликовано ср, 15/04/2009 - 19:50 пользователем larin
Forums: 1. Добавил валидацию загружаемых книг.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 15 часов
Isais RE:DNS 6 дней Саша из Киева RE:Приключения белочки Рыжки 1 неделя alex-from RE:Оплатил два раза, но абонемента нет 1 неделя sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 неделя Kiesza RE:На 78-м году жизни скончался советский и российский... 1 неделя Paul von Sokolovski RE:Бушков умер. 3 недели lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 3 недели mig2009 RE:Багрепорт - 2 3 недели Isais RE:Издательство "Медуза" 3 недели babajga RE:Народные сказки - Сказки народов Сибири = Fairy-Tales of... 1 месяц Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 месяц sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 месяц Isais RE:Игорь Северянин - Том 2. Поэзоантракт 1 месяц sem14 RE:Современная корейская литература. Книжная серия... 1 месяц sem14 RE:Семейственность в литературе 1 день Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 1 месяц Саша из Киева RE:Подводное течение 2 месяца Впечатления о книгах
Belomor.canal про Юзефович: Зимняя дорога. Генерал А. Н. Пепеляев и анархист И. Я. Строд в Якутии. 1922–1923 (Историческая проза, Биографии и Мемуары, Документальная литература)
14 11 Чем эта "Зимняя дорога" (/b/805592) изданная в 2015 г отличается от уже залитой /b/564252 ???? Оценка: плохо
nevskaya25 про Муляр: Мать велела герань не поливать [сборник litres] (Современная проза)
14 11 Я не в курсе, кто эта Таша Муляр, чему она посвятила свою жизнь, кроме "писательства". Явно одно: автору за это дело браться не стоило, повар - вари борщи, экономист -цифры в столбик складывай. Но писать не надо. Это сложно, ……… Оценка: нечитаемо
nevskaya25 про Муляр: Рожденная быть второй [litres] (Современная проза, Современные любовные романы, Секс и семейная психология)
14 11 Начала читать, бросила, вернулась снова, поскольку есть привычка дочитывать начатое. Дочитала таки. Это не слабо, это очень слабо. Ощущение, что автор кроме газет ничего не читала в жизни. Хотела всяких цитат набросать, ……… Оценка: нечитаемо
Дей про Император Пограничья
14 11 Читать можно, но нужно учесть некоторые особенности. Все вокруг или подлые, или несчастные. Несчастных ГГ защищает, с подлыми воюет. Наивность, пафос и идеализм зашкаливают. На данный момент серия насчитывает 14 томов ………
Олег Макаров. про Мажор [Останин, Викторов]
13 11 Достаточно хорошо написано, чтобы я дочитал до конца и хотел прочитать продолжение. Мент из нашего времени попадает в сына князя в типа параллельный, магический мир когда тот умирает от наркоты. И по сложным , но реалистичным ………
Олег Макаров. про Кас: Оживший камень (Городское фэнтези, Самиздат, сетевая литература)
13 11 Вроде бы даже интересно. Но как-то занудно. Возможно, дело в том что очень медленно развивается сюжет. Прочитал 87% книги и бросил
Lena Stol про Поселягин: Кровь Архов. Книга первая [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
13 11 Как у автора всё просто. герой тупой, но предприимчивый, денег не считает(вернее, автор за него всё посчитал), удача прёт, зачем герою мозги! Не интересно. Оценка: нечитаемо
Lena Stol про Поселягин: На просторах неизвестной планеты. Книга первая [СИ] (Попаданцы)
13 11 Какой-то бред. Дальше начала не продвинулась. Оценка: нечитаемо
tvv про Павлов: Древесный маг Орловского княжества 9 (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
11 11 Это форматирование автора на АТ ((( https://author.today/work/492088 Нет, не я. На андроиде фбе нет.
alexk про Павлов: Древесный маг Орловского княжества 9 (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
10 11 Не знаю, кто это делал, но это какая-то специальная сборка FBE, портящая книги? все дефисы заменены на тире с пробелами, где надо и, главное, где не надо. Даже по аннотации видно. tvv, ничего подобного. Источник - цоколь, ………
mysevra про Купер: Ящер с планеты Моз [The Lizard of Woz ru] (Юмористическая фантастика, Научная фантастика)
10 11 Замечательный автор – оригинально, ёмко, с юмором. Это касается всех рассказов, которые мне попадались. Оценка: отлично!
mysevra про География, краеведение: Чернигов [фотоальбом] (Путеводители)
10 11 Чудовий ностальгічний фотоальбом! Справжня історія. Жабок вже немає, серце крається дивитися на залишки КСК, шкода «Градецький», а по готелю «Україна», Драмтеатру та кінотеатру Щорса (і не тільки) влучили кляті нелюди. Зараз ……… Оценка: отлично! |
Отв: Валидация fb2
Что-то маловато будет для существующих. AFAIK, очень много книг, которые ты перегонял в fb2 скриптом ("стартовый" контент либрусека), не проходят валидацию из-за ошибок того скрипта (в тексте оставались символы "больше" и "меньше", интерпретируемые как теги читалками).
А что есть сам валидатор, на чем написан, где можно пощупать?
Отв: Валидация fb2
написан на пыхе, пощупать можно в архиве librusec.zip завтра, как перегенерируется.
Отв: Валидация fb2
Отец, зачод! Пасибки.
Отв: Валидация fb2
Спасибо!
Отв: Валидация fb2
Спасибо большое!
Отв: Валидация fb2
ref
Отв: Валидация fb2
Спасибо! Хоть ясно, с чем бороться )
А нумерацию файлов в списке можно организовать? И как-нибудь общую цифру?
типа в заголовке:
Файлы, не прошедшие валидацию - "столько-то"
1....
2...
3...
и т.д.
Отв: Валидация fb2
Класс! Спасибо.
А полученный список динамический? Что будет, если я десяток книг из него исправлю? Исчезнут они из списка или придётся повторить прогонку, чтобы создать новый список?
Отв: Валидация fb2
Динамический, похоже )) Я уже исправил и залил новую версию одной книжки с объединением версий.
Из списка она пропала достаточно быстро ))
Отв: Валидация fb2
Оптимально! Ларину - очередной виват! :)
Отв: Валидация fb2
Здравствуйте!
У меня есть минимум одна валидная книга, встретившаяся в списке (просто взгляд упал) - с Альда. Правда, я её ещё не читал / не вычитывал.
С удовольствием заменю. Список полистаю повнимательней, может быть ещё что-нибудь найду.
Как исправлять, удалять, добавлять? Хорошо бы иметь какую-нибудь однообразную методику или рекомендации.
Отв: Валидация fb2
А в чем проблема то? Вон справа ссылка "Добавление книги", на нее жмете и выбираете fb2 до двух мегабайт. Все просто.
Отв: Валидация fb2
OK! Добавил. А как реагировать (и надо ли) на полученное сообщение "Книга 47389 заменена на исправленную (удалить связь)"? Сорри, у меня мало опыта...
Отв: Валидация fb2
Никак. Сервер нашел дубль и его удалил.
Отв: Валидация fb2
Ура!
А хорошо бы это куда-нибудь на видное место.
Отв: Валидация fb2
http://lib.rus.ec/stat/ - куда уж виднее. Всё там собрано.
Отв: Валидация fb2
Всегда теперь худшие дубли автоматически удалять будут? Хорошо бы. А как оно само определяет, какая книга лучше?:)
Отв: Валидация fb2
Оно так и было с самого начала.
Только повадки неестественного интеллекта меняются.
Отв: Валидация fb2
Вспомнилось "1.0:1.0 версия не лучше" по отношению к libruseс_kit :))) А потом еще было забавно, когда оставляло более позднюю дату - 2011 год, опять же Librusec_kit :)
Кстати, а как такая дата получилась?
Отв: Валидация fb2
Чудны повадки неестественного интеллекта...
Отв: Валидация fb2
Здравствуйте!
Возможно, в скрипте, формирующем список невалидных файлов, есть ошибка, связанная с чтением тега (book-title) или с монтированием его для вывода...
Файл из списка (цитата):
«img - Не гневи колдуна! (Гусляр - 6 : Гусляр навеки-4) 12K (365) (читать) (скачать) - Кир Булычев»
Скаченный (скачать - http://lib.rus.ec/b/9589/download ) невалидный файл имеет в теге (book-title): «Не гневи колдуна !». т.е., кроме невалидности, содержит ошибку и в названии книги - лишний пробел между словом и восклицательным знаком.
Вопрос: Откуда разница названий книги: в списке не так, как в файле?
Спасибо.
Отв: Валидация fb2
В списке показаны названия из базы данных. Кто-то исправил ошибку через страницу редактирования книги, в базе данных появилось новое название, а в файле осталось старое.
Отв: Валидация fb2
Спасибо!
Файл обновился удачно, судя по сообщению "Книга 9589 заменена на исправленную (удалить связь)".
А два дня назад он добавился как новый. Пришлось разбираться, удалять исправленный-добавленный, и просить помощи.
Отв: Валидация fb2
М-м-м, кажется, валидатор использует тот FictionBookGenres.xsd, в котором нету «Литературоведения» (sci_philology), — я сделал новый .fb2 для «Драмы на дне» (старый файл был в списке невалидных), а валидатор указал, что нету такого жанра в схеме. :( Получилась замена невалидного на… невалидное. :)
Или жанр «Литературоведение» можно проставлять только на страничке редактирования, а в самом дескрипшене *.fb2 его прописывать нельзя?
Отв: Валидация fb2
Этот жанр Ларин недавно добавил по просьбам трудящихся. В грибовском списке его нету.
Отв: Валидация fb2
Я ж сам и был этими «просящими трудящимися»! :D И то, что жанра нету в Грибовском списке, мне прекрасно известно. :)
У меня тут была не претензия к валидатору, а уточняющий вопрос к Ларину, только и всего.
Отв: Валидация fb2
Хм.. :) А может действительно оторвать проверку жанров, раз уж движок сам их проверяет? Чтобы не повторяться. В общем я тут подправил xsd, если вдруг понадобится.
Отв: Валидация fb2
Не-не, не отрывай, полезная штука, пущай будет! Оченно удобно проверять файлы до заливки. И проверка жанров тоже нужна — мне, во всяком случае, ибо я с *.fb2 работаю не в спецредакторах, а в обычном текстовом, EditPlus’е. :)
Отв: Валидация fb2
Ну тогда надо взять новый FictionBookGenres.xsd отсюда.
Отв: Валидация fb2
Спасибки! :)
Правда, я себе локально сей .xsd уже собственноручно поправил, но остальным пригодится, факт. Если, конечно, Ларин нам не скажет, что в дескрипшене эти либрусековские жанры прописывать нельзя.
Отв: Валидация fb2
Можно.
Мало-ли что там валидатор бурчит, пропустил - значит можно.
Отв: Валидация fb2
Gut! :)
Э-э-э… это в смысле, что можно в дескрипшене сразу жанр прописывать. А не обращать внимание на валидатор не смогу — Ordnung muß sein! Зиг одер Тод! Каррамба! :D
Отв: Валидация fb2
Досточтимый сэр, а нельзя ли чудный список невалидных файлов http://lib.rus.ec/stat/invalid имени камрада lankier'a снабдить нумерами спереди по порядку?
Он большой и в нем трудновато ориентироваться.
Можно, конечно, отгрызать книжки с концов, но бывает и в середине за что-то зацепишься....
Отв: Валидация fb2
Можно.
Отв: Валидация fb2
Большое спасибо!
Отв: Валидация fb2
Возможно где-то туплю, но выложил на ftp файл, который не проходит валидацию здесь, хотя прекрасно валидируется из .NET со схемой скачанной с www.fictionbook.org.
Файл A_Night_in_the_Lonesome_October.fb2
Выдаваемая ошибка наводит на мысли что срубилась не валидация - а скорее всего парсинг XML, причем не совсем понятно на чем - файл во вполне легальной Win-1252.
Fatal Error 6003: input conversion failed due to input error, bytes 0x8D 0x41 0x6E 0x64 on line 0
Fatal Error 6003: input conversion failed due to input error, bytes 0x8D 0x41 0x6E 0x64 on line 0
Error 1544: encoder error on line 0
Fatal Error 77: Premature end of data in tag p line 1420 in /www/ocr/A_Night_in_the_Lonesome_October.fb2 on line 1420
Fatal Error 77: Premature end of data in tag section line 1342 in /www/ocr/A_Night_in_the_Lonesome_October.fb2 on line 1420
Fatal Error 77: Premature end of data in tag body line 32 in /www/ocr/A_Night_in_the_Lonesome_October.fb2 on line 1420
Fatal Error 77: Premature end of data in tag FictionBook line 2 in /www/ocr/A_Night_in_the_Lonesome_October.fb2 on line 1420
Найдены ошибки!
Error 1872: The document has no document element. on line 0
Отв: Валидация fb2
Win-1252 совершенно нелегальна.
Легальных кодировок и так слишком много - две.
Правильная utf8 и неправильная 1251. Остальные - нелегальны.
Отв: Валидация fb2
Перевод в utf8 не спасает. Ошибка остается. Файл nlo1.fb2 на ftp.
Отв: Валидация fb2
Первый же экран - <p><Hi. I'm a watchdog.></p>
В fb2 нет тега <Hi.>
Отв: Валидация fb2
Это вообще-то кавычка типографская, а не угловая скобка. :-) Если смотреть бинарным вьюевром в 1252 - то код у неё не 0x3c, а 0xAB. Если в utf8 - два байта 0xC2, 0xAB. Как-то тег все-таки не так оформляется. ;-)
Посмотрите, pls, внимательно на ошибку - это не ошибка XSD валидатора.
Отв: Валидация fb2
Указанная валидатором строчка (1420):
<p><8d>And the dizziness is not quite dizziness. It feels good."</p>
Что там за ужас вместо открывающей кавычки?
Отв: Валидация fb2
Спасибо, прошло.
Отв: Валидация fb2
Это никакая не «типографская» кавычка, а совершенно левый знак препинания. :)
Английские кавычки первого уровня — это “” (&_#8220; и &_#8221;). Английские «вложенные» кавычки — ‘’ (&_#8216; и &_#8217;). Пример: “quotes ‘inside’ quotes”.
Отв: Валидация fb2
Хочу ещё предложить по ходу дела удалять мусор из названия книги (например, альтернативные названия) и переносить его по возможности в аннотацию. А также обновлять номер версии и добавлять историю изменений типа:
<history><p>1.1 : xml and fb2 validation errors fixes</p>
</history>
Отв: Валидация fb2
Хочу Вам предложить лучше продумывать свои предложения.
Отв: Валидация fb2
Мои предложения очень хорошо обдуманы и базируются на пятилетнем опыте работы с электронными библиотеками (MARC и всё такое, ага?). Так вот альтернативные названия, названия серии и прочее в названии книги — это мусор. Дополнительная информация помещается в соответствующие поля (серия в sequence), а если таковой нет — в комментарии.
Отв: Валидация fb2
Почему? (Ну кроме эстетических соображений)
Отв: Валидация fb2
Где их становится невозможно найти поиском.
Отв: Валидация fb2
прикрутить поиск по аннотации не такая уж архисложная проблема.
Отв: Валидация fb2
Клауза "Мои предложения очень хорошо обдуманы", как я понимаю, снимается. Вот и ладненько.
Страницы