Вы здесьeBookDownloader и валидация книжек. ВАЖНО!!!!
Опубликовано сб, 05/04/2008 - 15:44 пользователем Bullfear
Вобщем перед тем как заливать книжку(скачанную ebookDownloader-ом у конкурентов) в библиотеку ее надо проверить на валидность. Надеюсь все знают как это делать? Иначе получаються оччень неприятные вещи. Вот пример текста книжки(Скобочки <> заменены на () ): Тоесть невалидные абзацы тупо пропадают! Есть идеи как можно автоматизировать чистку книг? По сути надо автоматизировать закрывание абзацев, если абзац не закрыт. Или хотя бы какая читалка(для кпк естественно) показывает нормальный текст?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 2 дня
kopak RE:Таинственная личность админа Флибусты 4 дня Isais RE:Не тот автор 5 дней xieergai60 RE:Продление подписки 1 неделя TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 1 неделя Isais RE:Древняя Греция. Читаем... 1 неделя laurentina1 RE:Ирина Александровна Велембовская - Немцы 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Саша из Киева RE:Избранное 2 недели Alligatoreader RE:Багрепорт - 2 2 недели fedor.de RE:Отображение страницы Librusek 3 недели Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 3 недели blahblahblah2024 RE:Беженцы с Флибусты 3 недели sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 3 недели sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 1 месяц Oleg V.Cat RE:B343695 Александр. Книга 1 1 месяц Isais RE:Калибрятина/Самиздатина 1 месяц md2k15 RE:Относительно Вархаммер 40 000 1 месяц Впечатления о книгах
alexgor1 про Дойль: Затерянный мир (Научная фантастика, Приключения: прочее)
11 12 Огромная благодарность выложившим данную редакцию увлекательного произведения, я сам познакомился с Артуром Конан Дойлом именно по этой книге "Затерянный мир" в мягкой обложке 56 года издательства "Географгиз" в переводе Натальи ……… Оценка: отлично!
udrees про Бубновский: Мифы о здоровье. Откуда берутся болезни (Здоровье, Альтернативная медицина)
09 12 Когда я начал читать книгу, то был немного разочарован тем, что она написана при поддержке и содействии канала «Военная тайна» и Игоря Прокопенко. Уже одно это говорит о «качестве» материала. Не знаю, уж знал Бубновский о ……… Оценка: плохо
udrees про Бубновский: Здоровье позвоночника. Упражнения от болей в шее и спине при остеохондрозе и межпозвоночных грыжах. Золотая книга [litres] (Медицина, Здоровье)
09 12 Хорошая очередная книга от Бубновского. Узнал кое-что новое, даже в дополнение после прочитанных его других книг. Например, про грыжу много написано. Есть иллюстрации и описания упражнений. Будет полезно прочитать всем, кто страдает от болей в спине. Оценка: хорошо
udrees про Бубновский: Заговор фармацевтов (Альтернативные науки и научные теории)
09 12 Книга, сочетания которой я не понимаю. С одной стороны Бубновский, серьезный доктор, лечащий болезни спины у людей, методику и советы которого лично я тоже использую, и которая помогла мне избавиться от сильных болей в шее. ……… Оценка: плохо
udrees про Бубновский: Колени и стопы без боли. Как сохранить и восстановить подвижность суставов в домашних условиях [litres] (Здоровье)
09 12 Все правильно описано, подробно, с изложением анатомии простым языком, примерами из жизни. Приведены упражнения с иллюстрациями. Их правда не так много, как обычно в других его книгах по кинезитерапии. Прочитать будет полезно, ……… Оценка: отлично!
Maxxim про Терентьев: Точка невозврата (Боевик)
08 12 началось живенько и идея ничего, но потом.... вдаваться смысла нет ,в общем - автор дурак.
Sello про Розенблат: Рассказы [СИ] (Проза, Эссе, очерк, этюд, набросок)
08 12 Я не знаю, где живет сейчас этот товарищ, но, по указанной дате под рассказиками, в 2016г. он пребывал в Израиле. Вот проблема. "Писатель" выставляет перед некоторыми текстами эпиграфы из Набокова, а собственно само написанное ……… Оценка: нечитаемо
Dongel про Шалашов: Господин следователь 1 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
07 12 Дочитал четвертую книгу цикла. Мне очень понравилось! Во-первых, автор проделал колоссальную работу, собирая исторические и архивные материалы. Во-вторых, все повествование очень увлекательно, почти нигде нет "провисающих" ……… Оценка: отлично!
Саша из Киева про Шатирян: Музыкантская команда (Детская проза)
07 12 Кто-нибудь сможет преобразовать эту книгу из djvu в fb2?
Олег Макаров. про Мусаниф: Во имя рейтинга (Юмористическая фантастика)
07 12 Великолепная книга. Как, в общем-то и все остальные у Мусанифа. Что касается мнения уважаемой Vetrenitsa «я категорически не согласна с тем, что, что по телевизору покажут, в то люди и поверят» — думаю, последние три ……… Оценка: отлично!
Isais про Велипольский: Три «Остапа» [СИ] (Научная фантастика, Самиздат, сетевая литература)
06 12 Это, надо заметить, очень редкая птица — научная фантастика, которую следовало бы написать и издать в 1924-м. Или, по крайней мере, в 1956-м. А она каким-то странным образом залетела в 2016-й... Выходит, и среди рассказов бывают «попаданцы».
Mila_48 про Сорока: Чорна Рада, 1663 [uk] (История)
06 12 С благодарностью верстальщику за возможность прочитать эту книгу. Удачи! Оценка: отлично! |
Комментарии
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Это разработчику надо писать:
http://www.liveinternet.ru/users/dimzon541/
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Встречал обращения людей с подобными багами на форуме the-ebook.org. Там, насколько я припоминаю, дело было в альдовских файлах fb2. Возможно, тэги были не закрыты и в исходном тексте - тогда eBookDownloader ни при чем, он ведь хмл на валидность не проверяет.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Вполне возможно. Браузеру то по барабану - он автоматом закрывает. А вот в HaaliReader абзацы пропадают :(
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Не знаю... Читаю с Haali на КПК, и не замечал пропуска абзацев как будто, в том числе и в книгах, полученых с помощью ЕБД. Теперь буду присматриваться повнимательнее.
Кстати, Haali на КПК - единственная читалка, которая может автоматом сделать оглавление при определенном формате абзацев файла txt, и я это широко использую на работе, поэтому перейти на другую читалку никак не могу.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Сам недавно заметил :( Попробуй скачать Княжеский пир 2 Никитина. Цитата вверху оттуда.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
я fb2 читаю ICE Book Reader`ом. У меня у всех файлов с абзацами все впорядке.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Проблема решилась. Надо было просто выкинуть ";№%% Haalireader и поставить нормальный AIReader.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Haali не трож)) лучшая (и быстрая) читалка имхо.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Тоже так думал. Пока не поставил AIReader :) Листает Haali лучше, но проблема в том, что не отображает абзацы в "кривых" книжках (выше пример). Хотя может быть появиться новая версия и тогда... :)
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Сомневаюсь, что в Хаали эта проблема решится.
Там принципиально парсинг тегов параграфов сделан с расчетом на их парность.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Вообще проверить XML на соответствие схеме (в данном случае FB2) - задача тривиальная. По-хорошему, это должно делаться сайтом при каждом приеме fb2 от пользователя.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
И сразу лишимся doc и pdf.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Bullfear, откуда такой вывод ? При заливке fb2 проверяется валидность, а при заливке других форматов не проверяется, т.е. идёт в обход проверки.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
В хаали гемор с абзацами.
Я так понимаю там не отсутствие замыкающего тега а вложенный параграф типа (p)bla bla(p)bla(/p)(/p).
Но на всякий пожарный пришли образец на pisem.net@teolog. Сделаю очередную попытку фикса.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
ebookDownloader пока не умеет делать валидный fb2
Ни одна книга, сохраненная им в fb2 валидации не прошла. Ошибок при этом много: стихи форматируются как эпиграфы, не все теги нормально закрываются и т.д. Собрать книгу руками в результате получается быстрее, чем выправить то, что сделал ebookDownloader. :0(
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Поправить не так долго. В среднем нужно 5-10 минут, если сносок не очень много.
Добавить аннотацию и информацию о книге, убрать section у названия и автора, объединить пустые секции, исправить структуру, если она разветвленная , у эпиграфов исправить вложенный тэг epigraph на author-name, исправить стихи, добавить сноски. В FBE это занимает, как уже написал 5-10 минут.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Это время очень сильно зависит от сложности оформления книги. В книгах, кроме перечисленного вами, ещё и иллюстрации бывают, которые данлоадер только и умеет, что сохранять на диск - и за это автору спасибо. Дерните данлоадером ту же "Ртуть" Нила Стивенсона (http://lib.aldebaran.ru/author/stivenson_nil/stivenson_nil_rtut/) и проверьте, сколько времени у вас уйдет, чтобы вернуть оформление книги хотя бы к альдебарановскому - про печатное я уже и не говорю. Скажете, что 5-10 минут - соврёте.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Последние версии dowloadera вполне нормально сохраняют иллюстрации в fb2 документе.
На Ртуть немного больше времени, минут 20, из-за 56 сносок.
Хотя я хотел не меряться, кто быстрей, а просто пожелать выкладывающим неправленый fb2 утянутый даунлоадером потратить немного времени, и привести документ в нормальный вид.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Пришлите список того что не так, я попытаюсь поправить. Только поконкретней. Насчет сносок не совсем понятно что делать, не всегда понятно что это сноска поэтому я их вообще не обрабатывал.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Создаются лишние секции по подзаголовкам (самый самый частый пример - подзаголовок "* * *") и по началу каждой страницы, на которые книга разбита для онлайн-чтения.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Это не баг, это фича. В некоторых книгах заголовков просто нет, есть только подзаголовки. В результате получается одна здоровая секция и при чтении на некоторых читалках появляются дикие тормоза. Кроме того оказалось что создать несколько заголовков в одной секции значит нажить себе кучу неприятностей. Читалки именно заголовки почему то ненавидят.
Поэтому при встрече с заголовком создается новая секция, так же новая секция создается когда софтина оконечательно отчаивается разобратся с форматированием. Чаще всего на альдебаране.
Так что если не возникает артефактов при отображении, лучше не трогать.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Н-да.
Вот именно поэтому, чем бороться с подобными "фичами", куда проще и быстрее делать fb2 руками, с нуля.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
Подскажите лучший софт для конветации в fb2 или сами чем пользуетесь.
Re: eBookDownloader и валидация книжек. ВАЖНО!!!!
В данный момент я пользуюсь исключительно FB Writer-ом и копипастом. Для конвертации из doc в принципе можно пользоваться утилитами doc2fb или грибовской any2fb, но там контроль и ручная правка всё равно нужны. Any2fb, кстати, понимает не только doc, но и txt, rtf, html и др.