Вы здесьbash: пакетное переименование fb2
Опубликовано вт, 08/07/2008 - 12:53 пользователем ground0
Переименовываем fb2 в каталогах (плюс подкаталоги), попутно проверяя xml на правильность и перекодируя в UTF-8. UPDATE: Ай-яй-яй. В прошлой версии было возможно зацикливание find'а. Поэтому складываем переименованные файлы в отдельный новый (под)каталог. Примерно так. Заодно раскидываем по подкаталогам с именем первого автора из title-info: #!/bin/bashPerl-скрипт для преобразования русских имён в транслит: #!/usr/bin/perlТе же скрипты в прицепе:
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 12 часов
DGOBLEK RE:Прошу переформатировать, распознать, etc... 5 дней akorish RE:Регистрация 5 дней Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 неделя konst1 RE:Ух, как я не люблю спамеров! 1 неделя tvv RE:DNS 3 недели sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 3 недели larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца Впечатления о книгах
alexgor1 про Иосиф Абрамович Рапопорт
09 05 «...у него никогда не было кабинета, у него не было практически стола, у него никогда не было секретаря, у него никогда не было машинистки, даже когда он был выбран член-корреспондентом». 14 марта 1912 года в Чернигове в ………
pulochka про Донцова: Британец китайского производства. Народный детектив (Дамский детективный роман)
08 05 Донцова совсем исписалась :куча ошибок, то у нее персонаж по фамилии Подаркин- Игорь,то он же-Михаил....И рассказ вообще настолько сумбурный, словно писали 2 разных человека .Причем они не договаривались о подробностях .Короче,видимо ……… Оценка: нечитаемо
Isais про Кратт: Великий океан (Историческая проза)
08 05 Проверил по оглавлению книги 1959 г. изд.: "Часть четвертая" и "Часть первая", которые якобы отсутствуют, -- фиктивные сущности. Их НЕТ. Т.е. этот файл содержит полный текст двухтомного романа.
Iskinder про Демина: Леди, которая любила лошадей (Любовная фантастика)
08 05 2 Анни-Мари. Я любовную фантастику в принципе не читаю, но ваш отзыв сильно порадовал. Браво!
Анни-Мари про Демина: Леди, которая любила лошадей (Любовная фантастика)
07 05 pulochka, мышки плакали, но продолжали жрать кактус. Вы уже не впервые жалуетесь, как вам не нравится язык Деминой, да насколько вам трудно воспринимать текст, и вот мрачно, понимаешь. Вопрос: зачем мучиться и читать, если оно не заходит? Страдания очищают?
francuzik про Матвеев: Пасечник – 2 (Фэнтези, Попаданцы, Самиздат, сетевая литература)
07 05 Ох эти сказки, ох эти сказочники... Оценка: плохо
Isais про Робертс: Королевский гамбит [The King's Gambit ru] (Исторический детектив)
07 05 То же место в то же время, что и в цикле Ст. Сейлора "Roma sub rosa" -- те же исторические персонажи и события, заговоры и убийства. Но как же скуууууушно по сравнению с Сейлором! Оценка: неплохо
Barbud про Линник: Обменный фонд (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
06 05 Читабельно. Первая половина книги более динамична, чем вторая, к концу пошло много малоинтересных бытовых подробностей, мелких дорожных приключений и т.п., но дочитал. Эпилог повеселил) Оценка: хорошо
Nicout про Смирнов: Колдун при дворе его величества. (Фэнтези, Повесть, Самиздат, сетевая литература)
06 05 А тут на встречу царь!" Плодовитый как кролик, но по сути безграмотная школота, фтопку! Даже качать не буду. И другим не советую, вполне хватает одной странички на АТ, чтобы пожелать развидеть. Оценка: нечитаемо
Никос Костакис про Вязовский: Кодекс врача [litres] (Альтернативная история, Попаданцы)
05 05 – Полиция бы сразу доложила, – покачала головой княгиня, подошла к одной из икон. – Смотрите, Евгений Александрович! Какая тут древняя роспись __________ Княгиня (!) называет иконы росписью. Окультуренная княгиня.
iwanwed про Аллард: Назад в СССР: Классный руководитель (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
05 05 Автор на знает эпохи, о которй пишет. Может быть, он застал в школе 90-е, но никак не конец 70-х, начало 80-х. И это портит впечатление о книге. Царапает и коробит. Оценка: плохо
tvv про Лис: Ученик гоблина. Книга III (Боевая фантастика, Фэнтези, Самиздат, сетевая литература)
04 05 Вторая книга есть на Ф., но файл плохо отформатирован. Читать можно, а заливать сюда не велено. |
||||||
Комментарии
Re: bash: пакетное переименование fb2
Эээ....У меня не хватит опыта всё это повторить...
А есть какой-то GUI-вариант?..
Re: bash: пакетное переименование fb2
Я не интересовался.
Мне удобнее CL.
Re: bash: пакетное переименование fb2
2ground0 и остальным.
А нет ли у вас скрипта проверяющего парность
< p> ... </p>и при ее отстутствии исправляющим fb2 файл.Например,
<p> ... <p> ... </p> -> <p> ... </p>.Если такового нет, м.б. кто-нибудь напишет на perle. У меня хорошо написать не получилось. Думаю такой скрипт будет полезен не только мне.
Re: bash: пакетное переименование fb2
Ещё один велосипед? xmllint все теги проверяет, <p> в том числе. И обнаруженные ошибки показывает, причём с номерами строк. (Ежели интегрировать в vim, вообще песня.)
А автоматическое исправление есть зло.
Re: bash: пакетное переименование fb2
Так кто мешает посмотреть результат автоматического исправлениия при помощи указанных вами средств. А непарные
<p>...</p>- очень характерная ошибка, хотелось бы ее исправлять автоматически..Есть ли аналог xmllint в windows? Хотелось бы его интегрировать в emeditor.
2SlaNT - спасибо за скрипт.
Re: bash: пакетное переименование fb2
Есть вроде сборка для windows (а чего сейчас нет?): http://www.zlatkovic.com/pub/libxml/ . Пакет libxml2. vim для windows можно взять на офсайте: http://www.vim.org/download.php#pc , - если что.
Схемы для FB2 можно взять на www.fictionbook.org, можно и без схем, просто как xml проверять.
Re: bash: пакетное переименование fb2
Очередное проприетарное говноподелие с собственным макросным недоязычком?
Re: bash: пакетное переименование fb2
Очередной линуксоид с марса?
Re: bash: пакетное переименование fb2
Да linuxoid , хочу на марс , ищу спонсоров на 8*10^10$ , категорически не понимаю пользовательского нутряного хамства. Человек по своей инициантиве пишет , раздает исходники чтобы вы смогли их приспособить по надобности ,А быдло кричит : ХОчУ чтоб работало под моей программой х. Причем автор ищи прогу , покупай её или нарушай закон ,но подай на тарелочке сегодня . Одно слово - пишите сами или гоните бабки.
Под Pspad И MEDIT СКРИПТ ПОДГОНЯЕТСЯ ЗАМЕНОЙ ОДНОЙ СТРОЧКИ
find "$@" -type f -name "*.fb2" | \
заменяется на
echo "$1" | \
Далее см документацию редактора по подвешиванию скрипта
Для medit
homepage - http://mooedit.sourceforge.net/
Re: bash: пакетное переименование fb2
Очередное говноподелие с собственным макросным недоязычком? =1
Re: bash: пакетное переименование fb2
Ну я писал про Emeditor - он получше будет чем medit.
Спасибо всем за ответы на мои вопросы.
Лучшее, что пока удалось сделать это интегрировать xmllint в PSPAD (путем компиляции текста - cntrlF9). Однако, не получается переход (по клику на сообщение об ошибке окошке log) на строчку с ошибкой в основном окне, чего бы очень хотелось. У кого нибудь это работает?
Re: bash: пакетное переименование fb2
В виме работает: set errorformat=%f:%l:\ %m
Re: bash: пакетное переименование fb2
Да вим штука замечательная.
Изначально я его и попробовал (gvim 7.1) , но не показывает (зараза) UTF-8 файлов - зюки (с 1251 - все нормально).
Не смог пока эти зюки победить.
Re: bash: пакетное переименование fb2
А ты его открой в нужной кодировке:
:e ++enc=utf8
Re: bash: пакетное переименование fb2
не в тот пост написал
Re: bash: пакетное переименование fb2
>В виме работает: set errorformat=%f:%l:\ %m
Да вим штука замечательная.
Изначально я его и попробовал (gvim 7.1) , но не показывает (зараза) UTF-8 файлов - зюки (с 1251 - все нормально).
Не смог пока эти зюки победить.
Re: bash: пакетное переименование fb2
Насколько мне помнится, надо просто сменить шрифт.
:help guifont
Re: bash: пакетное переименование fb2
Или же вим не определяет кодировку.
:e ++enc=utf8
set fileencodings=utf8,cp1251 в ~/.vimrc.
(Чё-то жоско глючит кэширование на либрусеке, сцуко.)
Re: bash: пакетное переименование fb2
Re: bash: пакетное переименование fb2
Я не совсем про это.
Иногда страницы отображаются не полностью, остаётся от всей темы, скажем, один заголовок. Дальше - обрыв хтмля. (Не до конца преобразуется вики-разметка, что ли?)
Обновление страницы здесь не очень помогает.
А "сохранять" два раза я не жму, ага, научился уже.
Re: bash: пакетное переименование fb2
Спасибо получилось - нужно вставить в vimrc set encoding=utf-8.
А вот xmllint не заработало:
после компиляции сообщение:
!xmmlint --valid --nooout >D:\DOCUME~\Admin\LOCALS~1\Temp\VIeB0.tmp 2 >&1
В указанной директории файл VIeB0.tmp не создается.
Re: bash: пакетное переименование fb2
За что на Python так ополчились ?
Re: bash: пакетное переименование fb2
Ну наверное такое решение только для фанатов vim :)
Мой вариант проще :) http://lib.rus.ec/node/101686
Отв: bash: пакетное переименование fb2
В первом скрипте рекомендую дополнить команду, устанавливающую title, командой sed так: title=`2csv < $tempfile2 title-info book-title | head -n 1 | sed 's/^"\(.*\)"$/\1/'`
чтобы кавычки, которыми обрамляются сложные текстовые строки в csv (напрпример, содержащие запятую) правильно удалялись. Кажется, ru2tr не удаляет кавычки, не проверял, ибо транслит мне не нужен.
Ваш блог отличный, а за этот пост со скриптами особенное спасибо.
Отв: bash: пакетное переименование fb2
Удаляет. Но если через него не пускать, не помешает, согласен. Вместе с другими спецсимволами, типа слэша.
На здоровье.
Отв: bash: пакетное переименование fb2
Вопрос: насколько этот транслит похож на Альдебарановский/Литресовский? А то мне тут понадобилось для fb2-file renamer-а, хочется чтобы близко к существующим было. (я на Перле пишу, но не перловкой, а как будто родным-любимым, только покалеченным, C пользуюсь - перловые идиомы ненавижу и рзбираться в них не хочу и не буду, ни-за-что, разве что за деньги)
Отв: bash: пакетное переименование fb2
Скрипт был утянут отсюда. Не знаю как с альдом/литресом, а на либрусековский не похож.
Вот ф-я на PHP из librusec.rar:
function translitcyr($cyr_str) {$transtbl = array("Ґ"=>"G","Ё"=>"Yo","Є"=>"E","Ї"=>"Yi","І"=>"I",
"і"=>"i","ґ"=>"g","ё"=>"yo","№"=>"N","є"=>"e",
"ї"=>"yi","А"=>"A","Б"=>"B","В"=>"V","Г"=>"G",
"Д"=>"D","Е"=>"E","Ж"=>"Zh","З"=>"Z","И"=>"I",
"Й"=>"Y","К"=>"K","Л"=>"L","М"=>"M","Н"=>"N",
"О"=>"O","П"=>"P","Р"=>"R","С"=>"S","Т"=>"T",
"У"=>"U","Ф"=>"F","Х"=>"H","Ц"=>"Ts","Ч"=>"Ch",
"Ш"=>"Sh","Щ"=>"Sch","Ъ"=>"","Ы"=>"Yi","Ь"=>"",
"Э"=>"E","Ю"=>"Yu","Я"=>"Ya","а"=>"a","б"=>"b",
"в"=>"v","г"=>"g","д"=>"d","е"=>"e","ж"=>"zh",
"з"=>"z","и"=>"i","й"=>"y","к"=>"k","л"=>"l",
"м"=>"m","н"=>"n","о"=>"o","п"=>"p","р"=>"r",
"с"=>"s","т"=>"t","у"=>"u","ф"=>"f","х"=>"h",
"ц"=>"ts","ч"=>"ch","ш"=>"sh","щ"=>"sch","ъ"=>"",
"ы"=>"yi","ь"=>"","э"=>"e","ю"=>"yu","я"=>"ya",
" "=>'_', '"'=>'', "'"=>'',":"=>'', "("=>'_',")"=>'_',"["=>'_',"]"=>'_',"{"=>'_',"}"=>'_',
'ў'=>'y', '…' => '.', '!'=>'','“'=>'','”'=>'', '`'=>'', '—'=>'-',
'?'=>'',','=>'','\''=>'','«'=>'','»'=>'', '&'=>'_', '#' => 'N');
return str_replace('__','_', strtr($cyr_str, $transtbl));
}
Отв: bash: пакетное переименование fb2
а ведь неверное преобразование =((
ГОСТ 7.79:2000 для транслита
Крайний: ГОСТ 7.79:2000 "Система стандартов по информации, библиотечному и издательскому делу. Правила транслитерации кирилловского письма латинским алфавитом."
#!/usr/bin/python -O
# -*- coding: utf-8 -*-
_Translit = { # GOST 7.79-2000
u"а":"a", u"А":"A",
u"б":"b", u"Б":"B",
u"в":"v", u"В":"V",
u"г":"g", u"Г":"G",
u"д":"d", u"Д":"D",
u"е":"e", u"Е":"E",
u"ё":"jo", u"Ё":"Jo",
u"ж":"zh", u"Ж":"Zh",
u"з":"z", u"З":"Z",
u"и":"i", u"И":"I",
u"й":"jj", u"Й":"Jj",
u"к":"k", u"К":"K",
u"л":"l", u"Л":"L",
u"м":"m", u"М":"M",
u"н":"n", u"Н":"N",
u"о":"o", u"О":"O",
u"п":"p", u"П":"P",
u"р":"r", u"Р":"R",
u"с":"s", u"С":"S",
u"т":"t", u"Т":"T",
u"у":"u", u"У":"U",
u"ф":"f", u"Ф":"F",
u"х":"kh", u"Х":"Kh",
u"ц":"c", u"Ц":"C",
u"ч":"ch", u"Ч":"Ch",
u"ш":"sh", u"Ш":"Sh",
u"щ":"shh", u"Щ":"Shh",
u"ъ":"''", u"Ъ":"''",
u"ы":"y", u"Ы":"Y",
u"ь":"'", u"Ь":"'",
u"э":"eh", u"Э":"Eh",
u"ю":"ju", u"Ю":"Ju",
u"я":"ja", u"Я":"Ja",
}
def translit(s): return ''.join([_Translit.get(c,c) for c in s])
Отв: bash: пакетное переименование fb2
Спасибо за скрипт.
В Ubuntu 10.10 для работы fb2_renamer.sh предварительно нужно установить пакет xml2.