Лингвистический анализ: Пути в незнаемое (Натан Эйдельман)
Общая статистика
Длина текста | 881509 знаков |
Длина диалогов | 79022 знаков |
Слов в произведении (СВП) | 126049 слов |
Приблизительно страниц | 490 стр. |
Средняя длина слова | 5.67 знаков |
Предложений в произведении (ПВП) | 9868 предл. |
Средняя длина предложения (СДП) | 86.45 знаков |
Доля диалогов в тексте | 8.96 % |
Доля авторского текста | 91.04 % |
СДП диалогов | 77.79 знаков |
СДП авторского текста | 101.80 знаков |
|
Максимальный фрагмент авторского текста - 133294 знаков (в страницах - примерно 74, начинается где-то с 224 страницы) |
Активный словарный запас
Использовано уникальных слов | 31626 | |
Активный словарный запас (АСЗ) | 30772 | |
Активный не словарный запас (АНСЗ) | 854 | |
Удельный АСЗ на 3000 слов текста | 1606.94 | 413881 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4332.41 | 362056 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 26766.82 | 57549 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1814) наблюдается примерно на 369 странице |
Минимальный УАСЗ-3000 (1135) наблюдается примерно на 416 странице |
|
Буквы и знаки препинания
Всего букв | 713864 букв |
Всего знаков препинания | 26810 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 14307 | 113.50 |
. | 8661 | 68.71 |
- | 1152 | 9.14 |
? | 685 | 5.43 |
! | 516 | 4.09 |
... | 0 | 0.00 |
!.. | 81 | 0.64 |
?.. | 43 | 0.34 |
!!! | 1 | 0.01 |
?! | 49 | 0.39 |
" | 0 | 0.00 |
() | 263 | 2.09 |
: | 859 | 6.81 |
; | 193 | 1.53 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 55192 | 7.73 |
Б | 11327 | 1.59 |
В | 32429 | 4.54 |
Г | 12141 | 1.70 |
Д | 21229 | 2.97 |
Е-Ё | 62352 | 8.73 |
Ж | 12141 | 1.70 |
З | 12175 | 1.71 |
И-Й | 61770 | 8.65 |
К | 26281 | 3.68 |
Л | 30770 | 4.31 |
М | 22531 | 3.16 |
Н | 48177 | 6.75 |
О | 78561 | 11.01 |
П | 19038 | 2.67 |
Р | 32789 | 4.59 |
С | 38524 | 5.40 |
Т | 45480 | 6.37 |
У | 18256 | 2.56 |
Ф | 2108 | 0.30 |
Х | 7510 | 1.05 |
Ц | 3471 | 0.49 |
Ч | 10994 | 1.54 |
Ш | 4648 | 0.65 |
Щ | 2474 | 0.35 |
Ь-Ъ | 12784 | 1.79 |
Ы | 14598 | 2.04 |
Э | 2750 | 0.39 |
Ю | 4202 | 0.59 |
Я | 12995 | 1.82 |
|
Части речи
Определенных частей речи (ОЧР) | 125787 слов |
Не определенных частей речи (НОЧР) | 262 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 39377 | 31.305 |
Глаг. | 8683 | 15.352 |
Мест.-сущ. | 8683 | 6.903 |
Предл. | 12152 | 10.843 |
Союз | 10184 | 8 |
Прилаг. | 12152 | 9.661 |
Нареч. | 7292 | 5.797 |
Местоим-прилаг. | 6127 | 4.871 |
Частица | 5482 | 4.358 |
Местоим. нареч. | 2018 | 1.604 |
Числит. | 969 | 0.770 |
Числит-прилаг. | 481 | 0.382 |
Междомет. | 43 | 0.034 |
Часть комп. сложн. слова | 29 | 0.023 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 82.54 | 53.77 | 17.27 | 43.47 | 38.33 | 26.58 | 17.22 | 14.22 | 11.14 | 5.34 | 1.90 | 1.08 | 0.10 | 0.07 |
Глаг. | 34.98 | 16.69 | 12.08 | 31.60 | 14.72 | 14.58 | 10.22 | 7.73 | 6.77 | 2.65 | 1.07 | 0.38 | 0.03 | 0.03 |
Мест.-сущ. | 11.05 | 20.53 | 3.46 | 5.32 | 5.17 | 4.84 | 7.31 | 2.75 | 6.53 | 1.62 | 0.30 | 0.13 | 0.01 | 0.01 |
Предл. | 57.84 | 1.58 | 13.28 | 0.72 | 1.03 | 16.91 | 0.95 | 12.57 | 0.10 | 0.05 | 2.08 | 1.24 | 0.02 | 0.06 |
Союз | 17.95 | 13.53 | 9.45 | 8.71 | 4.21 | 6.71 | 6.77 | 4.38 | 5.99 | 2.72 | 0.36 | 0.14 | 0.03 | 0.01 |
Прилаг. | 66.95 | 3.86 | 2.01 | 3.63 | 6.41 | 8.87 | 1.88 | 0.95 | 1.24 | 0.46 | 0.25 | 0.05 | 0.01 | 0.04 |
Нареч. | 5.41 | 17.81 | 3.32 | 5.82 | 5.00 | 6.74 | 6.03 | 1.85 | 4.44 | 0.93 | 0.49 | 0.12 | 0.02 | 0.00 |
Местоим-прилаг. | 21.97 | 5.52 | 3.50 | 2.58 | 1.61 | 6.33 | 2.11 | 1.53 | 2.50 | 0.72 | 0.26 | 0.08 | 0.01 | 0.01 |
Частица | 5.72 | 16.39 | 2.66 | 4.37 | 2.00 | 3.00 | 3.44 | 2.00 | 2.42 | 1.22 | 0.27 | 0.07 | 0.00 | 0.00 |
Местоим. нареч. | 1.57 | 3.37 | 1.66 | 1.63 | 1.92 | 1.00 | 1.73 | 0.49 | 2.27 | 0.26 | 0.10 | 0.03 | 0.00 | 0.01 |
Числит. | 4.34 | 0.29 | 0.23 | 0.39 | 0.33 | 0.58 | 0.20 | 0.12 | 0.10 | 0.04 | 0.63 | 0.46 | 0.00 | 0.00 |
Числит-прилаг. | 2.61 | 0.14 | 0.10 | 0.17 | 0.18 | 0.29 | 0.10 | 0.09 | 0.06 | 0.04 | 0.00 | 0.04 | 0.01 | 0.00 |
Междомет. | 0.06 | 0.02 | 0.02 | 0.02 | 0.07 | 0.01 | 0.02 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.10 | 0.00 |
Часть комп. сложн. слова | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.17 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 21.22 | 24.45 | 27.58 | 29.22 | 30.01 |
Глаг. | 9.50 | 19.38 | 19.01 | 18.25 | 16.91 |
Мест.-сущ. | 12.32 | 10.21 | 8.39 | 7.00 | 6.63 |
Предл. | 11.72 | 8.90 | 9.87 | 11.13 | 11.53 |
Союз | 17.73 | 6.11 | 5.71 | 6.34 | 7.33 |
Прилаг. | 5.34 | 7.09 | 7.94 | 8.95 | 9.45 |
Нареч. | 7.77 | 7.49 | 6.94 | 6.40 | 5.92 |
Местоим-прилаг. | 4.30 | 5.42 | 4.79 | 4.61 | 4.88 |
Частица | 5.41 | 6.76 | 6.44 | 5.24 | 4.59 |
Местоим. нареч. | 3.49 | 2.49 | 1.70 | 1.51 | 1.26 |
Числит. | 0.67 | 1.01 | 0.94 | 0.83 | 1.00 |
Числит-прилаг. | 0.37 | 0.63 | 0.62 | 0.46 | 0.49 |
Междомет. | 0.16 | 0.05 | 0.04 | 0.01 | 0.00 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.01 | 0.02 | 0.03 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 30.85 | 30.86 | 30.84 | 31.46 | 30.85 |
Глаг. | 16.13 | 16.11 | 14.89 | 14.67 | 14.23 |
Мест.-сущ. | 6.07 | 5.77 | 6.09 | 6.15 | 6.01 |
Предл. | 11.75 | 11.43 | 11.66 | 12.33 | 11.50 |
Союз | 7.32 | 7.54 | 6.92 | 8.01 | 8.08 |
Прилаг. | 10.28 | 10.76 | 11.50 | 11.33 | 11.82 |
Нареч. | 5.35 | 5.49 | 5.58 | 4.75 | 5.45 |
Местоим-прилаг. | 5.13 | 4.80 | 5.16 | 4.80 | 5.10 |
Частица | 4.76 | 4.34 | 4.58 | 4.08 | 4.13 |
Местоим. нареч. | 1.14 | 1.51 | 1.39 | 1.34 | 1.66 |
Числит. | 0.80 | 0.96 | 0.84 | 0.72 | 0.77 |
Числит-прилаг. | 0.37 | 0.35 | 0.51 | 0.27 | 0.36 |
Междомет. | 0.00 | 0.02 | 0.00 | 0.02 | 0.02 |
Часть комп. сложн. слова | 0.04 | 0.08 | 0.03 | 0.07 | 0.02 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 31.99 | 30.62 | 30.52 | 32.45 | 32.09 |
Глаг. | 14.48 | 15.64 | 14.89 | 14.03 | 14.12 |
Мест.-сущ. | 6.22 | 6.56 | 5.38 | 6.21 | 7.12 |
Предл. | 11.87 | 11.32 | 12.20 | 12.13 | 10.91 |
Союз | 7.16 | 7.97 | 7.75 | 7.31 | 7.85 |
Прилаг. | 11.61 | 11.51 | 12.38 | 11.65 | 11.79 |
Нареч. | 5.07 | 4.25 | 5.66 | 4.90 | 4.95 |
Местоим-прилаг. | 5.13 | 5.38 | 4.55 | 5.81 | 5.08 |
Частица | 3.91 | 4.25 | 4.19 | 3.51 | 4.00 |
Местоим. нареч. | 1.50 | 1.13 | 1.24 | 1.11 | 0.98 |
Числит. | 0.66 | 1.01 | 1.03 | 0.57 | 0.73 |
Числит-прилаг. | 0.36 | 0.35 | 0.10 | 0.26 | 0.35 |
Междомет. | 0.04 | 0.00 | 0.03 | 0.03 | 0.03 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.08 | 0.06 | 0.00 |
Последние комментарии
20 часов 12 минут назад
1 день 1 час назад
1 день 9 часов назад
1 день 11 часов назад
1 день 11 часов назад
2 дней 23 часов назад