Лингвистический анализ: Идентификация Спрута (Сергей Щеглов)
Общая статистика
Длина текста | 606075 знаков |
Длина диалогов | 355604 знаков |
Слов в произведении (СВП) | 84959 слов |
Приблизительно страниц | 337 стр. |
Средняя длина слова | 5.71 знаков |
Предложений в произведении (ПВП) | 7087 предл. |
Средняя длина предложения (СДП) | 82.76 знаков |
Доля диалогов в тексте | 58.67 % |
Доля авторского текста | 41.33 % |
СДП диалогов | 82.14 знаков |
СДП авторского текста | 88.55 знаков |
|
Максимальный фрагмент авторского текста - 7341 знаков (в страницах - примерно 4, начинается где-то с 72 страницы) |
Активный словарный запас
Использовано уникальных слов | 18638 | |
Активный словарный запас (АСЗ) | 17796 | |
Активный не словарный запас (АНСЗ) | 842 | |
Удельный АСЗ на 3000 слов текста | 1524.46 | 385141 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3977.98 | 56560 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1653) наблюдается примерно на 329 странице |
Минимальный УАСЗ-3000 (1338) наблюдается примерно на 234 странице |
|
Буквы и знаки препинания
Всего букв | 484847 букв |
Всего знаков препинания | 19976 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 8962 | 105.49 |
. | 7089 | 83.44 |
- | 1165 | 13.71 |
? | 1382 | 16.27 |
! | 785 | 9.24 |
... | 0 | 0.00 |
!.. | 0 | 0.00 |
?.. | 3 | 0.04 |
!!! | 1 | 0.01 |
?! | 129 | 1.52 |
" | 0 | 0.00 |
() | 1 | 0.01 |
: | 224 | 2.64 |
; | 235 | 2.77 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 41558 | 8.57 |
Б | 8757 | 1.81 |
В | 22699 | 4.68 |
Г | 7296 | 1.50 |
Д | 13644 | 2.81 |
Е-Ё | 37029 | 7.64 |
Ж | 7296 | 1.50 |
З | 9671 | 1.99 |
И-Й | 37824 | 7.80 |
К | 18656 | 3.85 |
Л | 24304 | 5.01 |
М | 16612 | 3.43 |
Н | 30488 | 6.29 |
О | 52710 | 10.87 |
П | 14776 | 3.05 |
Р | 23431 | 4.83 |
С | 25711 | 5.30 |
Т | 28785 | 5.94 |
У | 14533 | 3.00 |
Ф | 1206 | 0.25 |
Х | 4212 | 0.87 |
Ц | 2362 | 0.49 |
Ч | 6741 | 1.39 |
Ш | 4638 | 0.96 |
Щ | 1604 | 0.33 |
Ь-Ъ | 8983 | 1.85 |
Ы | 8401 | 1.73 |
Э | 1597 | 0.33 |
Ю | 2605 | 0.54 |
Я | 9819 | 2.03 |
|
Части речи
Определенных частей речи (ОЧР) | 84947 слов |
Не определенных частей речи (НОЧР) | 12 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 25872 | 30.457 |
Глаг. | 6720 | 19.314 |
Мест.-сущ. | 6720 | 7.911 |
Предл. | 6814 | 9.777 |
Союз | 5969 | 7 |
Прилаг. | 6814 | 8.021 |
Нареч. | 5023 | 5.913 |
Местоим-прилаг. | 3523 | 4.147 |
Частица | 3725 | 4.385 |
Местоим. нареч. | 1185 | 1.395 |
Числит. | 972 | 1.144 |
Числит-прилаг. | 364 | 0.429 |
Междомет. | 57 | 0.067 |
Часть комп. сложн. слова | 11 | 0.013 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 77.64 | 70.24 | 19.53 | 35.12 | 34.01 | 19.73 | 19.62 | 9.98 | 10.92 | 3.90 | 2.51 | 0.99 | 0.32 | 0.05 |
Глаг. | 62.16 | 25.50 | 15.88 | 32.90 | 14.26 | 14.36 | 10.50 | 7.11 | 6.24 | 1.95 | 1.54 | 0.67 | 0.07 | 0.00 |
Мест.-сущ. | 9.35 | 25.00 | 5.23 | 6.69 | 4.12 | 6.27 | 8.35 | 3.34 | 8.12 | 1.93 | 0.60 | 0.09 | 0.01 | 0.00 |
Предл. | 47.41 | 2.41 | 13.95 | 0.54 | 1.14 | 16.55 | 0.84 | 11.32 | 0.18 | 0.05 | 2.33 | 0.99 | 0.01 | 0.05 |
Союз | 9.59 | 16.29 | 10.34 | 6.58 | 3.84 | 3.53 | 7.26 | 3.24 | 6.49 | 2.63 | 0.28 | 0.19 | 0.01 | 0.00 |
Прилаг. | 59.33 | 5.13 | 1.35 | 2.84 | 3.05 | 5.53 | 0.94 | 0.62 | 0.72 | 0.27 | 0.33 | 0.05 | 0.04 | 0.01 |
Нареч. | 4.89 | 23.86 | 4.45 | 5.49 | 3.40 | 4.52 | 4.71 | 1.72 | 4.38 | 0.85 | 0.65 | 0.16 | 0.06 | 0.00 |
Местоим-прилаг. | 20.58 | 3.67 | 2.54 | 2.06 | 1.60 | 5.34 | 1.78 | 1.12 | 1.79 | 0.57 | 0.26 | 0.15 | 0.00 | 0.01 |
Частица | 4.51 | 16.68 | 3.58 | 3.87 | 2.70 | 2.27 | 3.26 | 2.25 | 2.67 | 1.58 | 0.38 | 0.07 | 0.02 | 0.01 |
Местоим. нареч. | 1.26 | 2.97 | 1.94 | 1.19 | 1.62 | 0.55 | 1.51 | 0.47 | 2.19 | 0.16 | 0.06 | 0.01 | 0.01 | 0.00 |
Числит. | 4.91 | 0.72 | 0.07 | 0.31 | 0.24 | 1.26 | 0.26 | 0.21 | 0.04 | 0.07 | 2.47 | 0.89 | 0.00 | 0.00 |
Числит-прилаг. | 2.71 | 0.48 | 0.21 | 0.16 | 0.14 | 0.26 | 0.08 | 0.08 | 0.11 | 0.00 | 0.04 | 0.01 | 0.00 | 0.00 |
Междомет. | 0.12 | 0.18 | 0.04 | 0.02 | 0.15 | 0.01 | 0.02 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.12 | 0.00 |
Часть комп. сложн. слова | 0.12 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 22.64 | 23.12 | 26.11 | 31.68 | 31.60 |
Глаг. | 11.66 | 24.37 | 27.13 | 23.40 | 21.61 |
Мест.-сущ. | 13.43 | 10.37 | 9.18 | 7.73 | 7.78 |
Предл. | 9.09 | 7.50 | 8.70 | 9.36 | 9.14 |
Союз | 13.03 | 5.89 | 5.23 | 6.07 | 7.54 |
Прилаг. | 5.05 | 5.13 | 5.57 | 6.55 | 7.12 |
Нареч. | 9.12 | 7.90 | 6.04 | 5.11 | 5.38 |
Местоим-прилаг. | 3.81 | 3.95 | 4.26 | 3.91 | 3.90 |
Частица | 7.47 | 7.96 | 4.89 | 3.07 | 3.07 |
Местоим. нареч. | 2.89 | 1.99 | 1.24 | 1.52 | 1.20 |
Числит. | 1.14 | 1.32 | 1.01 | 1.17 | 1.11 |
Числит-прилаг. | 0.35 | 0.42 | 0.54 | 0.36 | 0.51 |
Междомет. | 0.32 | 0.06 | 0.08 | 0.06 | 0.03 |
Часть комп. сложн. слова | 0.01 | 0.01 | 0.02 | 0.02 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 29.48 | 31.39 | 29.66 | 27.99 | 28.70 |
Глаг. | 21.08 | 19.67 | 19.64 | 17.77 | 18.15 |
Мест.-сущ. | 7.31 | 7.07 | 7.56 | 7.50 | 7.94 |
Предл. | 10.29 | 9.88 | 11.09 | 12.26 | 11.47 |
Союз | 7.73 | 7.57 | 7.45 | 7.99 | 6.74 |
Прилаг. | 7.66 | 7.84 | 7.85 | 8.98 | 8.76 |
Нареч. | 5.48 | 5.70 | 5.50 | 5.73 | 5.45 |
Местоим-прилаг. | 4.12 | 4.28 | 4.01 | 4.83 | 5.18 |
Частица | 3.77 | 3.78 | 4.36 | 4.22 | 4.55 |
Местоим. нареч. | 1.25 | 1.15 | 1.12 | 1.17 | 1.10 |
Числит. | 1.27 | 1.21 | 1.14 | 1.12 | 1.48 |
Числит-прилаг. | 0.47 | 0.46 | 0.55 | 0.36 | 0.49 |
Междомет. | 0.07 | 0.00 | 0.02 | 0.07 | 0.00 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.02 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 28.93 | 28.41 | 28.29 | 29.96 | 28.51 |
Глаг. | 17.93 | 18.00 | 16.26 | 17.66 | 15.74 |
Мест.-сущ. | 7.26 | 8.34 | 7.43 | 6.59 | 7.47 |
Предл. | 11.10 | 12.26 | 11.11 | 11.85 | 12.24 |
Союз | 7.17 | 7.29 | 7.23 | 6.31 | 7.90 |
Прилаг. | 10.23 | 9.21 | 11.39 | 12.08 | 11.55 |
Нареч. | 6.00 | 5.32 | 5.47 | 5.12 | 4.61 |
Местоим-прилаг. | 4.30 | 4.76 | 4.99 | 3.98 | 5.19 |
Частица | 4.23 | 3.82 | 4.67 | 3.98 | 3.87 |
Местоим. нареч. | 1.21 | 1.02 | 1.32 | 1.10 | 1.17 |
Числит. | 1.05 | 1.26 | 1.48 | 0.96 | 1.38 |
Числит-прилаг. | 0.43 | 0.28 | 0.32 | 0.41 | 0.21 |
Междомет. | 0.06 | 0.04 | 0.04 | 0.00 | 0.11 |
Часть комп. сложн. слова | 0.09 | 0.00 | 0.00 | 0.00 | 0.05 |
Последние комментарии
19 часов 56 минут назад
20 часов 10 минут назад
21 часов 18 минут назад
1 день 8 часов назад
1 день 8 часов назад
1 день 9 часов назад