скрипт для лингвистического анализа текста
Опубликовано вс, 28/12/2008 - 12:58 пользователем Wictor
Forums: Просматривая отзывы на книгу Хаецкой Царство небесное натолкнулся на интересную статистику, сгенерированную скриптом (http://fantlab.ru/work9929): Цитата: Лингвистический анализ текста: Учитывая то, что большинство современных книг весьма низкого качества, задумался: можно ли дать предварительную оценку книги на основании этих цифр. Вообще при выборе книги вы бы на такую статистику обращали бы внимание?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
DGOBLEK RE:Прошу переформатировать, распознать, etc... 2 дня
akorish RE:Регистрация 3 дня DGOBLEK RE:Подайте бедному копеечку на книжку с литреса... 2 дня Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 4 дня Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 5 дней konst1 RE:Ух, как я не люблю спамеров! 6 дней tvv RE:DNS 3 недели sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 3 недели larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 3 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 3 месяца tvv RE:faq brainstorm =) 3 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 3 месяца Впечатления о книгах
Nicout про Смирнов: Колдун при дворе его величества. (Фэнтези, Повесть, Самиздат, сетевая литература)
06 05 А тут на встречу царь!" Плодовитый как кролик, но по сути безграмотная школота, фтопку! Даже качать не буду. И другим не советую, вполне хватает одной странички на АТ, чтобы пожелать развидеть. Оценка: нечитаемо
Никос Костакис про Вязовский: Кодекс врача [litres] (Альтернативная история, Попаданцы)
05 05 – Полиция бы сразу доложила, – покачала головой княгиня, подошла к одной из икон. – Смотрите, Евгений Александрович! Какая тут древняя роспись __________ Княгиня (!) называет иконы росписью. Окультуренная княгиня.
iwanwed про Аллард: Назад в СССР: Классный руководитель (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
05 05 Автор на знает эпохи, о которй пишет. Может быть, он застал в школе 90-е, но никак не конец 70-х, начало 80-х. И это портит впечатление о книге. Царапает и коробит. Оценка: плохо
tvv про Лис: Ученик гоблина. Книга III (Боевая фантастика, Фэнтези, Самиздат, сетевая литература)
04 05 Вторая книга есть на Ф., но файл плохо отформатирован. Читать можно, а заливать сюда не велено.
Aleks_Sim про Йейтс: Кельтские сумерки: рассказы (Классическая проза, Мифы. Легенды. Эпос)
03 05 TO DGOBLEK - а там в оригинале строфные пробелы в двух или трех стихах отсутствуют
Lan2292 про Владимиров: Отблески в зеркалах (Боевая фантастика, Самиздат, сетевая литература)
03 05 Пыталась читать прорываясь сквозь бесконечный справочник, в результате бросила. Н сколько можно, пять страниц описание плющек с подробностями а сюжета на три строчки. Оценка: неплохо
pulochka про Карина Демина
03 05 О книге"Леди,которая любила лошадей" Язык мой-враг мой! Мадам Лесина-Демина и т.д ! Вы пытаетесь подражать эпохе? Ну ,а что в итоге-дебри дремучие. Вы сами -то можете до конца прочитать свои опусы? И ведь в каждой истории ………
Олег Макаров. про Фаберже
02 05 Первые две книги серии читал с интересом, на третьей остановился Надоело. Постоянные описания «технологии изготовления» и рутина затмевают ту немногую движуху, которая всё-таки есть
Олег Макаров. про Шоу: Молодые львы [litres] (Классическая проза)
02 05 Очень хорошо написано. Глубокая вещь Но блин... Как же грустно Оценка: отлично!
Олег Макаров. про Старый: Наставникъ (Альтернативная история, Исторические приключения, Попаданцы, Самиздат, сетевая литература)
02 05 Фуфло. Шовинизм, учитель истории, ненавидящий всех иностранцев и т.д. Z литература, хотя и другое время |
Отв: скрипт для лингвистического анализа текста
Хотите поверить алгеброй гармонию? :)
Нет. Цифры любопытные, но, увы, о качестве книги они ровным счетом ничего не говорят.
Отв: скрипт для лингвистического анализа текста
А если бедный язык у автора? Ну т.е. значение "Активный словарный запас"?
Отв: скрипт для лингвистического анализа текста
Вы считаете, что у Елены Хаецкой "бедный язык"? :)
Отв: скрипт для лингвистического анализа текста
Я вот тоже очень удивилась. Зато выявилась достоверность "скриповой" оценки текста. :)
Отв: скрипт для лингвистического анализа текста
Под словом "автор" я имел в виду автора гипотетического. Хаецкая мне нравится, хотя в некоторых ее произведения встречаются повторы чуть ли не абзацев. Например куски текста из Саги о Хелоте встречаются в Харольде.
Отв: скрипт для лингвистического анализа текста
Не люблю говорить о сферических конях в вакууме. В Вашем примере активный словарный запас автора "ниже среднего". С творчеством автора Вы знакомы. Значит, можете сделать выводы. Вы считаете, что у данного автора "бедный язык"? Если ответ "да", то Вы можете смело использовать данный скрипт для предварительной оценки произведения :)
Отв: скрипт для лингвистического анализа текста
На именно такую статистику - скорее не обращал бы, чем обращал.
Но вообще-то идея не такая уж дурацкая, гармонию - не гармонию, а некоторые характеристики текста программно поймать вполне можно, хоть тот же "Штампомер" вспомнить. У меня давно свербила идея попробовать на зубок тексты людей, явно не умеющих писать (ака графоманов).
Есть как минимум два довольно легко формализуемых признака графоманского текста:
1. Избыток восклицательных знаков в прямой речи героев.
2. Вязкость словоупотребления, то бишь - одинаковые или однокоренные слова в соседних предложениях (например "Но вообще-то идея не такая уж дурацкая..." и "У меня давно свербила идея...").
Был ешё и третий признак, но я его, каюсь, забыл...
Отв: скрипт для лингвистического анализа текста
Вот ещё можно вдоволь поиграться: http://rusf.ru/books/analysis/ :)
Отв: скрипт для лингвистического анализа текста
Можно обращать и на такую но ... только строить ее не по книге, а по автору. Т.е. ввести весь его опубликованный корпус и построить профиль, желательно в привязке ко времени, что б была видна и динамика. Но при этом не забывать, что это относительные характеристики и их надо сравнивать с "подпольем" и "потолком" ;), т.к. средняя температура по больнице ничего толкового не выявит.