Обвал книжек (и вопрос к программистам)

Только я один себя чувствую волком в старой электронной игре? О_o

Куча интересных файлов, и все в DOC-ах. Просто разорваться, а еще кроме перекодирования дела есть... : ( Я и сам приложил руку к закачке в не-fb2, чисто до лучших времен когда смогу сконвертить, пока спрос на эти файлы нулевой.)

Может, возможно привязать к сайту какую-нибудь api-приблуду (от Google например), которая делает налету из DOC-а HTML - чтобы книжка индексировалась и главное могла быть прочитана.

Я переживаю. Книжки лежат, а их никто не читает.

Комментарии

Аватар пользователя Isais

Ясно. Конвертить .doc и .txt в FB2 и заменять их на FB2 - корректно во всех смыслах, даже в этическом.

Isais
И ещё одно. Очень редко здесь попадаются и ДОКи и ТХТ в очень хорошем виде -максимум на четвёрочку.

wotti написал:
Isais
И ещё одно. Очень редко здесь попадаются и ДОКи и ТХТ в очень хорошем виде -максимум на четвёрочку.

IMHO, DOC ещё как-то может быть оформлен на 5-ку, но TXT- просто по определению не может быть очень хорошим из-за бедности формата: только голый текст и никаких шрифтовых выделений.
По-моему, очевидно.

Zadd написал:
wotti написал:
Isais
И ещё одно. Очень редко здесь попадаются и ДОКи и ТХТ в очень хорошем виде -максимум на четвёрочку.

IMHO, DOC ещё как-то может быть оформлен на 5-ку, но TXT- просто по определению не может быть очень хорошим из-за бедности формата: только голый текст и никаких шрифтовых выделений.
По-моему, очевидно.

Смотря кому очевидно ))) В ТХТ могут присутствовать номера страниц, нечитаемые символы, ошибки ОСР, не обозначенные сноски (оформленные как массив текста , не выделены пробелами заголовки и ещё куча всего. Правильно оформить ТХТ - не пятисекундное дело

wotti написал:
Zadd написал:
wotti написал:
Isais
И ещё одно. Очень редко здесь попадаются и ДОКи и ТХТ в очень хорошем виде -максимум на четвёрочку.

IMHO, DOC ещё как-то может быть оформлен на 5-ку, но TXT- просто по определению не может быть очень хорошим из-за бедности формата: только голый текст и никаких шрифтовых выделений.
По-моему, очевидно.

Смотря кому очевидно ))) В ТХТ могут присутствовать номера страниц, нечитаемые символы, ошибки ОСР, не обозначенные сноски (оформленные как массив текста , не выделены пробелами заголовки и ещё куча всего. Правильно оформить ТХТ - не пятисекундное дело

:D
LOL
Ну да, ну да, но то, что ты перечислил, это может быть в любом формате и в принципе, можно убрать из дока эти недоделки. Тогда, теоретически, ДОК может стать идеальным, а вот TXT идеальным стать не сможет, потому что в нем нет разметки текста на части и главы и нет выделений другим шрифтом(хотя бы просто жирный и курсив - и тех нет). Если конечно, не считать fb2 видом TXT.
Или может, я тебя не понял? Может ты считаешь присутствие в TXT номера страниц, нечитаемые символы, ошибки ОСР, не обозначенные сноски ПРЕИМУЩЕСТВОМ формата TXT?
О том, что TXT правильно сконвертировать может быть непросто, я и сам знаю не понаслышке. Об этом и речи в посте не было.
Кажется, кто-то, не будем уточнять кто, хотя точно не я, опять отвечает не глядя на пост, на который он отвечает:)
Аватар пользователя Mylnicoff

Zadd написал:
Кажется, кто-то, не будем уточнять кто, хотя точно не я, опять отвечает не глядя на пост, на который он отвечает:)

Вы про разные вещи говорите: вы про то, что txt вообще формат плохой для книг, а wotti про то, что бывает хороший и плохой файл txt (разумеется, в тех рамках, что возможности формата предоставляют).
Аватар пользователя Isais

Ну да. И ещё одно, вчера столкнулся: чистый .doc, приличного качества (немного дефисов пришлось на тире позаменять да орфографию слегка поправить) - и никакой дополнительной информации: откуда, какая серия, где публиковалось... Пришлось сеть трясти, но ни обложки, ни одной иллюстрации так и не выудил %(((

Обычно этого в файлах не бывает. Чтобы доставать доп.инфу я использую Озон, на крайний случай - Alib

По поводу замены doc на fb2. Помимо упоминавшейся литературы non-fiction, не нужно конвертировать в fb2 поэзию и драматургию. Причины те же - невозможность адекватного графического представления текста.

Wotti, чем по-вашему отличаются доки оформленные "на четверочку", от качественных? (Я как-то предпочитаю доки делать, вот и интересуюсь.)

UPD Вот еще пример: сегодня кто-то выложил "Очерки поповщины" Мельникова-Печерского в fb2. И в результате имеем путаницу в примечаниях - слиты в кучу примечания из дореволюционного и современного изданий + пропала вся навигация. Конечно, кто будет 400 гиперссылок вручную ставить. А в док-версии это было. Жалко.

Цитата:
не нужно конвертировать в fb2 поэзию и драматургию

Если правильно оформить, то вполне адекватно выглядят и поэзия и драматургия.

Дайте ссылку хоть на один fb2, например со стихами Маяковского, который адекватно оформлен.

Никто просто не брался по-настоящему за Маяковского. Но начинания уже есть - http://lib.rus.ec/b/107674

Аватар пользователя s_Sergius

Алексей_Н написал:
Никто просто не брался по-настоящему за Маяковского. Но начинания уже есть - http://lib.rus.ec/b/107674

Может кто-нибудь знает волшебный символ, который на экране выглядел бы как пробел, но не съедался "генеральной уборкой".
Для оформления стихов лесенкой было б самое то.

s_Sergius написал:
Может кто-нибудь знает волшебный символ, который на экране выглядел бы как пробел, но не съедался "генеральной уборкой".
Для оформления стихов лесенкой было б самое то.
Неразрывный пробел и не юзать "генеральную уборку".
А ещё дучше - вот так:
Цитата:
<poem>
<stanza>
<v>А тётя хохотала,</v>
<v>когда она узнала,</v>
<v>что дядя нам</v>
<v style="margin-left: 3em">в наследство</v>
<v style="margin-left: 6em">не оставил</v>
<v style="margin-left: 9em">ничего, —</v>
</stanza>
</poem>
<p style="text-indent: 0px">драматически наяривали под Шопена трубы на холме.</p>
заодно ещё и абзац после стишка можно сделать без отступа.
Аватар пользователя s_Sergius

Рыжий Тигра написал:
Неразрывный пробел и не юзать "генеральную уборку".

Да это-то я знаю. Но кто-то может большой труд грохнуть одним щелчком мыши.
Думал, может есть что-то более безопасное.

Я вот знаю символ вместо дефиса для случаев типа -ая. Никакая "генеральная уборка" его в тире уже не превратит.

s_Sergius написал:
символ вместо дефиса для случаев типа -ая. Никакая "генеральная уборка" его в тире уже не превратит.
Э... мягкий перенос? Или о чём речь?
Аватар пользователя s_Sergius

Нет, мягкий перенос отображается в читалках и в режиме S FBE, но не виден в B.
Неразрывный дефис прекрасно виден в режиме B FBE, но в S и некоторыми читалками отображается странновато.
А вот −(&#8722;) выглядит как слегка удлиненный дефис (в юникодовских шрифтах) и "генеральная уборка" его игнорирует.

s_Sergius написал:
Неразрывный дефис прекрасно виден в режиме B FBE, но в S и некоторыми читалками отображается странновато.
"Неразрывный дефис" - это что? Я не в курсе...
s_Sergius написал:
А вот −(&#8722;) выглядит как слегка удлиненный дефис
А вот за это по рукам! 8722 - это не дефис, это арифметический минус! Во-первых, он шириной с цифру (что несколько до фига для дефиса), а во-вторых, он лежит чуть выше дефиса - специально для того, чтобы аккуратно смотрелся с цифрами, но со строчными буквами в качестве дефиса он торчит как горбыль. Не делай так.
Кстати, а если прямо в history написать - "не используйте генеральную уборку, она изгадит форматирование"? Я уже давно пишу такое в custom-info, но в history, кажется, будет более уместно...
Аватар пользователя s_Sergius

Рыжий Тигра написал:
"Неразрывный дефис" - это что? Я не в курсе...

Это символ, используемый в верстальных программах, да и в Worde тоже, вместо обычного дефиса, чтобы в этом месте не было переноса. Ну чтобы слова типа кто-то, как-то не разрывались.

Рыжий Тигра написал:
А вот за это по рукам! 8722 - это не дефис, это арифметический минус! Во-первых, он шириной с цифру (что несколько до фига для дефиса), а во-вторых, он лежит чуть выше дефиса - специально для того, чтобы аккуратно смотрелся с цифрами, но со строчными буквами в качестве дефиса он торчит как горбыль. Не делай так.

Да нормально он смотрится, не придирайся. В Times New Roman, да, несколько высоковато, а в Arial, Tahoma и Verdana вполне ничего. Я так целую книгу сделал: Правила русской орфографии и пунктуации. Полный академический справочник.
А jurgennt в Русском орфографическом словаре в подобных случаях тире использовал. Ему тоже по рукам?

Рыжий Тигра написал:
Кстати, а если прямо в history написать - "не используйте генеральную уборку, она изгадит форматирование"? Я уже давно пишу такое в custom-info, но в history, кажется, будет более уместно...

Да тут не будет лишним вовсюда написать.

s_Sergius написал:
Рыжий Тигра написал:
"Неразрывный дефис"
вместо обычного дефиса, чтобы в этом месте не было переноса.
Хм. Кодом не поделишься? Или где про него почитать?
s_Sergius написал:

Рыжий Тигра написал:
по рукам! 8722 - это не дефис, это арифметический минус!
Я так целую книгу сделал: Правила русской орфографии и пунктуации. Полный академический справочник.
А jurgennt в Русском орфографическом словаре в подобных случаях тире использовал. Ему тоже по рукам?

(подумав - твёрдо) Да. Обоим. А то я в знак протеста следующую книгу сделаю с одним только тэгом "p style=...", а заголовки с эпиграфами и стихами оформлю исключительно css'ом. :-)
s_Sergius написал:
Рыжий Тигра написал:
а если прямо в history написать - "не используйте генеральную уборку, она изгадит форматирование"?
Да тут не будет лишним вовсюда написать.

(подумав) Нет, всюду нельзя - будет мешать читать. Надо так, чтобы было видно только в редакторе. (ещё подумав - обрадованно) О, придумал! Написать всюду, но CSS'ом сделать "белым по белому" или "текст цветом фона" - в CoolReader'е будет не видно, а в FBE на ура. :-)
Аватар пользователя s_Sergius

Рыжий Тигра написал:
Хм. Кодом не поделишься? Или где про него почитать?

Насчет кода ты меня озадачил.
Я обычно вставляю его в Word'e через Вставка —> Символ —> Специальные знаки —> Неразрывный дефис (Ctrl+Shift+-), а в inDesign'e через Type —> Insert Special Character —> Hyphens and Dashes —> Nonbreaking Hyphen (Ctrl+Alt+-).
В общем, код такой: 8209.
Нормально виден в FBE (режим В) и в AlReader'e. В других читалках отображается в виде прямоугольничка или в виде ? (CoolReader 3).
Перспективы использование неразрывного дефиса для fb2 выглядят пока сомнительными, а вот при верстке книг на бумаге он бывает весьма и весьма полезен.

upd.
Упоминается в Википедии.

s_Sergius написал:
Неразрывный дефис [...] код такой: 8209.
Нормально виден в FBE (режим В) и в AlReader'e. В других читалках отображается в виде прямоугольничка или в виде ? (CoolReader 3).
Ага, действительно странно. У меня и в FBE2, и в CR3 установлена вердана - в FBE2 виден как "-", в CR3 как "?", т.е. отсутствующий символ. :-( Интересно, кто врёт?
Аватар пользователя s_Sergius

Рыжий Тигра написал:
Ага, действительно странно. У меня и в FBE2, и в CR3 установлена вердана - в FBE2 виден как "-", в CR3 как "?", т.е. отсутствующий символ. :-( Интересно, кто врёт?

Как ни жаль тебе это, может быть, признавать, но тут врет твой любимый CR3. И на старуху нашлась проруха...
upd.
Напомню, что Word, PageMaker, QuarkXPress и inDesign используют неразрывный дефис штатно и отображают его нормально для ВСЕХ шрифтов, т.е. это проблема не шрифта, а именно программы.

Аватар пользователя Ronja_Rovardotter

Цитата:
Кстати, а если прямо в history написать - "не используйте генеральную уборку, она изгадит форматирование"? Я уже давно пишу такое в custom-info, но в history, кажется, будет более уместно...

Если есть повод, то пишу такое обязательно и именно в хистори: сначала ля-ля-ля про версию, потом пустая строка и дальше что-то типа "NB Острожно используйте скрипт "Генеральная уборка", разметка, используемая в книге, может быть утеряна".

Ronja_Rovardotter написал:
и дальше что-то типа "NB Острожно используйте скрипт "Генеральная уборка",

Хм. А его что, можно использовать "осторожно"? :-)

Цитата:
Хм. А его что, можно использовать "осторожно"? :-)

Угу. На выбор.
Его можно либо использовать неосторожно, либо осторожно не использовать.

Аватар пользователя Ronja_Rovardotter

Рыжий Тигра написал:
Хм. А его что, можно использовать "осторожно"? :-)

В некоторых случаях и при определенных манипуляциях можно (те же стихи, отбитые пробелами, если их немного; заменить пробелы на что-то скриптом не перевариваемое, а потом вернуть обратно).
Но вообще да. Перейду на категорическое - НЕ ИСПОЛЬЗОВАТЬ И ТОЧКА! :)

Я просто в "генеральной уборке" сменил замену длинных тире на короткие.

Аватар пользователя Ronja_Rovardotter

Тигра, мне помнится у вас имеется электронная книга. Она понимает отбивку строк пробелами? Из компьютерных читалок адекватными оказались HaaliReader и Cool Reader.

Ronja_Rovardotter написал:
у вас имеется электронная книга. Она понимает отбивку строк пробелами?
Неразрывными пробелами - да, обычными (0x20) - нет. Собственно, это тот же CoolReader3.
А, кстати, неразрывные пробелы в разных шрифтах разной ширины - можно не угадать. :-( ИМХО CSS'ом отбивать куда надёжнее. :-)
Аватар пользователя Ronja_Rovardotter

Цитата:
Неразрывными пробелами - да, обычными (0x20) - нет. Собственно, это тот же CoolReader3.

CoolReader3 у меня на компьютере видит простые пробелы.
Цитата:
А, кстати, неразрывные пробелы в разных шрифтах разной ширины - можно не угадать.

Поэтому и не использую. И принципиальной разницы в пк-читалках не увидела: те, что понимают разметку пробелами - им без разницы простой пробел или неразрывный, те, которые не понимают - не видят ни тот, ни другой :(
Цитата:
ИМХО CSS'ом отбивать куда надёжнее.

Это та конструкция, которую вы чуть выше писали? Неплохо, но никакая программа, кроме CoolReader3 эту разметку не признает. Надежнее, но не универсально :(

Ronja_Rovardotter написал:
Цитата:
Неразрывными пробелами - да, обычными (0x20) - нет. Собственно, это тот же CoolReader3.

CoolReader3 у меня на компьютере видит простые пробелы.

В смысле - серию пробелов не схлопывает до одного? Хм... последний раз я пробовал с год назад, возможно, с тех пор что-то поменялось. Но куда вероятнее другое: если серия пробелов вставлялась в FBE2 - то он при добавлении пробела все соседние превращает в неразрывные, т.е. на самом в деле в цепочке пробелов, скорее всего, N-1 неразрывных и один обычный.
Ronja_Rovardotter написал:
Цитата:
CSS'ом

никакая программа, кроме CoolReader3 эту разметку не признает. Надежнее, но не универсально :(
Ну, остальные читалки ж тоже на месте не стоят? Кроме того, при появлении нового формата (fb3, fb2.5, nfb, ...) позволит более точно конвертировать.

Алексей_Н написал:
Никто просто не брался по-настоящему за Маяковского. Но начинания уже есть - http://lib.rus.ec/b/107674
Кошмар! Что бы сказал Владимир Владимирович, если бы увидел, что его "лесенку" отбивают сериями троеточий? Лучше б уж неразрывными пробелами или CSS-стилями (хоть и это не универсально, а значит и некузяво)...
Картинки - отдельный момент: пеликан, зебра, слон, белый медведь - полупрозрачные! В мальчике дыры, как от ПКТшной пули, а сквозь них проглядывает фон со всей его текстурой и игрой цвета! Сцена для ужастика про призраков... :-(

*поет*

ПОРА ПЕРЕХОДИТЬ НА epub!!!

Epub поддерживает CSS!!!

А-ла-ла-ла! : ]

Аватар пользователя Ronja_Rovardotter

Цитата:
невозможность адекватного графического представления текста.

Я бы сказала, что есть некоторые сложности, но "невозможность" - слишком громко и категорично. Надо смотреть по ситуации. Плюс читалку надо правильную подобрать, чтобы отражала все нюансы.

Цитата:
чем по-вашему отличаются доки оформленные "на четверочку", от качественных? (Я как-то предпочитаю доки делать, вот и интересуюсь.)

:) Вам точно не о чем волноваться. Ваши бы я заценила на "очень", но такие (тут wotti прав) действительно попадаются редко.

Цитата:
Вот еще пример...

Кривым/небрежным форматированием можно убить любой, даже самый прекрасный doc. Ничего не попишешь - как повезет с верстальщиком.

Ronja_Rovardotter написал:
Цитата:

Кривым/небрежным форматированием можно убить любой, даже самый прекрасный doc. Ничего не попишешь - как повезет с верстальщиком.

Поэтому лучше подстраховаться и не конвертировать в fb2 тяжелые файлы, вроде драматургии.

А Маяковского глянул - просто добавлена отбивка точками в начале строк в небольшом стихотворении. Не впечатлило. Сборник стихов так не сделаешь. Никакого терпения не хватит. (Подумал) Даже сама Ronja_Rovardotter не справится :)

Аватар пользователя Ronja_Rovardotter

Про драматургию ничего не скажу - надо смотреть.

Цитата:
А Маяковского глянул - просто добавлена отбивка точками в начале строк в небольшом стихотворении. Не впечатлило. Сборник стихов так не сделаешь. Никакого терпения не хватит.

Но вот вы собирались делать сборник стихов По - тоже ведь все вручную размечается. Нет?
Тренировалась на кошках на стихотворениях Грейвза (http://lib.rus.ec/b/186619), разноуровневой разметки там правда мало, но в целом ничего сложного не заметила, кропотливо просто.
Правда отбивала строки пробелами (до варианта с точками не додумалась, и, честно говоря, он мне не очень нравится). Если использовать правильную fb2-читалку - все красиво и на сайте тоже. Но вот обнаружила, что если выкачивать сборник в rtf-формате, то вся разноуровневая разметка в нем убивается. Поэтому хочу рядом все-таки положить doc для любителей формата и на случай если нужно распечатать.

Цитата:
Поэтому хочу рядом все-таки положить doc для любителей формата и на случай если нужно распечатать.

Да, это оптимальное решение. "Пусть цветут все цветы" (c)

Значится так. Если Вы увидели, что кто-то сделал негодный FB2, ХУЖЕ качеством чем исходный DOC/RTF/CHM, то надо
1. FB2 поставить качество 1 (появится череп с костями)
2. Файл исходный восстановить.

Если его опять удалят - это уже вандализм и можно писать библиотекарю.

Имхо, так.

Adan75 написал:
Только я один себя чувствую волком в старой электронной игре?
:-))))))))))))))
Только сейчас дошло, про какую игру с волком речь. :-)

Ну да, яйца катятся! : )

Простите, если не в тему. Пишу в наиболее подходящее.
1. я правильно понимаю, что теперь бесплатных книг не будет?
2. выложил книгу Алла Дымовская Доктор Самты Клаус в доке. (по другому не умею). При поиске по поиску "прочитать" не выдает. а при попытке скачать, пишет, что книга в ограниченном доступе и надо купить абонемент.
При поиске по страницам авторов появляется кнопка "прочитать" но открывает пустую страницу.
Это какой-то глюк? или ответ в первом вопросе? заранее спасибо.

Страницы

X