Лингвистический анализ: Собрание сочинений. Том пятый (Ярослав Гашек)
Общая статистика
Длина текста | 859850 знаков |
Длина диалогов | 265107 знаков |
Слов в произведении (СВП) | 129517 слов |
Приблизительно страниц | 478 стр. |
Средняя длина слова | 5.30 знаков |
Предложений в произведении (ПВП) | 8750 предл. |
Средняя длина предложения (СДП) | 95.42 знаков |
Доля диалогов в тексте | 30.83 % |
Доля авторского текста | 69.17 % |
СДП диалогов | 90.70 знаков |
СДП авторского текста | 117.79 знаков |
|
Максимальный фрагмент авторского текста - 24885 знаков (в страницах - примерно 14, начинается где-то с 204 страницы) |
Активный словарный запас
Использовано уникальных слов | 29092 | |
Активный словарный запас (АСЗ) | 27355 | |
Активный не словарный запас (АНСЗ) | 1737 | |
Удельный АСЗ на 3000 слов текста | 1544.79 | 413881 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4167.09 | 362056 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 24367.13 | 57549 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1767) наблюдается примерно на 472 странице |
Минимальный УАСЗ-3000 (1382) наблюдается примерно на 398 странице |
|
Буквы и знаки препинания
Всего букв | 683512 букв |
Всего знаков препинания | 28387 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 15434 | 119.17 |
. | 8029 | 61.99 |
- | 1363 | 10.52 |
? | 665 | 5.13 |
! | 1066 | 8.23 |
... | 0 | 0.00 |
!.. | 23 | 0.18 |
?.. | 18 | 0.14 |
!!! | 0 | 0.00 |
?! | 12 | 0.09 |
" | 0 | 0.00 |
() | 429 | 3.31 |
: | 1142 | 8.82 |
; | 206 | 1.59 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 56153 | 8.22 |
Б | 11166 | 1.63 |
В | 31702 | 4.64 |
Г | 12935 | 1.89 |
Д | 21345 | 3.12 |
Е-Ё | 57434 | 8.40 |
Ж | 12935 | 1.89 |
З | 10998 | 1.61 |
И-Й | 57074 | 8.35 |
К | 26296 | 3.85 |
Л | 31240 | 4.57 |
М | 21085 | 3.08 |
Н | 41792 | 6.11 |
О | 73609 | 10.77 |
П | 20195 | 2.95 |
Р | 32106 | 4.70 |
С | 35616 | 5.21 |
Т | 42638 | 6.24 |
У | 19085 | 2.79 |
Ф | 1706 | 0.25 |
Х | 6146 | 0.90 |
Ц | 3346 | 0.49 |
Ч | 10364 | 1.52 |
Ш | 6616 | 0.97 |
Щ | 2216 | 0.32 |
Ь-Ъ | 12271 | 1.80 |
Ы | 12252 | 1.79 |
Э | 2257 | 0.33 |
Ю | 4175 | 0.61 |
Я | 13124 | 1.92 |
|
Части речи
Определенных частей речи (ОЧР) | 128544 слов |
Не определенных частей речи (НОЧР) | 973 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 36405 | 28.321 |
Глаг. | 12185 | 17.154 |
Мест.-сущ. | 12185 | 9.479 |
Предл. | 9850 | 11.356 |
Союз | 11107 | 9 |
Прилаг. | 9850 | 7.663 |
Нареч. | 6366 | 4.952 |
Местоим-прилаг. | 6515 | 5.068 |
Частица | 5460 | 4.248 |
Местоим. нареч. | 2404 | 1.870 |
Числит. | 1041 | 0.810 |
Числит-прилаг. | 347 | 0.270 |
Междомет. | 165 | 0.128 |
Часть комп. сложн. слова | 51 | 0.040 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 64.32 | 52.25 | 18.66 | 41.83 | 40.97 | 20.14 | 13.58 | 13.12 | 9.32 | 6.22 | 1.80 | 0.54 | 0.38 | 0.09 |
Глаг. | 35.03 | 19.71 | 20.58 | 36.07 | 18.14 | 10.73 | 9.27 | 9.04 | 7.69 | 3.31 | 1.37 | 0.31 | 0.23 | 0.05 |
Мест.-сущ. | 13.91 | 29.87 | 6.32 | 9.34 | 6.61 | 5.32 | 7.98 | 3.56 | 8.39 | 2.57 | 0.63 | 0.14 | 0.13 | 0.02 |
Предл. | 59.19 | 1.39 | 18.16 | 0.75 | 1.18 | 15.26 | 0.71 | 13.75 | 0.08 | 0.04 | 1.94 | 0.99 | 0.01 | 0.11 |
Союз | 15.01 | 17.82 | 14.03 | 9.48 | 4.19 | 4.82 | 6.43 | 4.84 | 6.16 | 2.92 | 0.43 | 0.19 | 0.07 | 0.03 |
Прилаг. | 54.67 | 4.09 | 1.65 | 2.44 | 4.11 | 6.40 | 0.98 | 0.77 | 0.75 | 0.43 | 0.19 | 0.01 | 0.05 | 0.08 |
Нареч. | 4.08 | 17.82 | 4.08 | 5.06 | 4.36 | 3.78 | 4.02 | 1.54 | 3.42 | 0.70 | 0.49 | 0.09 | 0.05 | 0.01 |
Местоим-прилаг. | 23.04 | 5.66 | 4.37 | 2.62 | 1.67 | 6.62 | 1.86 | 1.47 | 1.94 | 0.86 | 0.39 | 0.14 | 0.04 | 0.00 |
Частица | 4.87 | 17.98 | 4.19 | 3.66 | 2.11 | 1.77 | 2.74 | 1.70 | 2.12 | 1.12 | 0.17 | 0.01 | 0.03 | 0.01 |
Местоим. нареч. | 1.76 | 4.10 | 2.35 | 1.88 | 2.55 | 0.89 | 1.74 | 0.51 | 2.33 | 0.47 | 0.12 | 0.01 | 0.01 | 0.00 |
Числит. | 5.16 | 0.45 | 0.17 | 0.22 | 0.19 | 0.54 | 0.15 | 0.27 | 0.12 | 0.02 | 0.55 | 0.25 | 0.00 | 0.00 |
Числит-прилаг. | 1.70 | 0.25 | 0.05 | 0.20 | 0.15 | 0.16 | 0.03 | 0.05 | 0.06 | 0.03 | 0.00 | 0.02 | 0.01 | 0.00 |
Междомет. | 0.23 | 0.14 | 0.16 | 0.02 | 0.18 | 0.05 | 0.05 | 0.07 | 0.09 | 0.02 | 0.01 | 0.01 | 0.26 | 0.00 |
Часть комп. сложн. слова | 0.23 | 0.01 | 0.00 | 0.00 | 0.00 | 0.16 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 17.58 | 22.98 | 25.43 | 26.03 | 27.85 |
Глаг. | 11.75 | 19.12 | 21.57 | 19.78 | 19.80 |
Мест.-сущ. | 13.79 | 15.45 | 11.97 | 11.07 | 9.09 |
Предл. | 12.42 | 8.23 | 10.33 | 11.04 | 10.92 |
Союз | 16.67 | 5.35 | 5.74 | 7.28 | 7.98 |
Прилаг. | 4.46 | 6.30 | 6.87 | 7.12 | 7.90 |
Нареч. | 7.02 | 6.94 | 5.80 | 5.92 | 4.70 |
Местоим-прилаг. | 4.71 | 5.35 | 4.54 | 5.15 | 4.73 |
Частица | 5.71 | 6.87 | 5.02 | 3.79 | 4.01 |
Местоим. нареч. | 4.53 | 2.25 | 1.67 | 1.66 | 1.61 |
Числит. | 0.63 | 0.65 | 0.68 | 0.66 | 0.88 |
Числит-прилаг. | 0.25 | 0.33 | 0.20 | 0.33 | 0.37 |
Междомет. | 0.49 | 0.14 | 0.12 | 0.11 | 0.13 |
Часть комп. сложн. слова | 0.00 | 0.04 | 0.05 | 0.06 | 0.04 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 28.36 | 28.98 | 28.08 | 27.96 | 27.47 |
Глаг. | 18.05 | 16.94 | 17.95 | 17.23 | 17.33 |
Мест.-сущ. | 8.49 | 8.86 | 8.28 | 8.82 | 8.59 |
Предл. | 12.14 | 12.19 | 12.05 | 11.91 | 12.00 |
Союз | 8.52 | 8.98 | 9.76 | 9.16 | 9.66 |
Прилаг. | 7.88 | 7.41 | 7.78 | 9.03 | 9.05 |
Нареч. | 4.87 | 4.78 | 4.63 | 4.05 | 4.35 |
Местоим-прилаг. | 4.94 | 4.81 | 5.11 | 5.07 | 4.78 |
Частица | 4.15 | 3.96 | 3.68 | 4.34 | 4.02 |
Местоим. нареч. | 1.65 | 1.67 | 1.56 | 1.42 | 1.72 |
Числит. | 0.62 | 1.00 | 0.75 | 0.69 | 0.68 |
Числит-прилаг. | 0.22 | 0.27 | 0.25 | 0.23 | 0.21 |
Междомет. | 0.05 | 0.12 | 0.07 | 0.08 | 0.06 |
Часть комп. сложн. слова | 0.06 | 0.05 | 0.05 | 0.02 | 0.08 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 28.97 | 26.96 | 27.72 | 29.03 | 27.60 |
Глаг. | 16.82 | 15.85 | 16.55 | 16.38 | 17.42 |
Мест.-сущ. | 8.68 | 9.44 | 7.94 | 8.65 | 8.18 |
Предл. | 12.20 | 13.47 | 12.44 | 11.83 | 11.62 |
Союз | 9.05 | 9.25 | 9.07 | 8.82 | 9.24 |
Прилаг. | 7.59 | 7.89 | 8.43 | 8.54 | 8.42 |
Нареч. | 3.94 | 4.67 | 4.65 | 4.61 | 4.44 |
Местоим-прилаг. | 5.36 | 5.32 | 5.19 | 5.22 | 6.07 |
Частица | 4.07 | 3.84 | 4.80 | 3.85 | 4.05 |
Местоим. нареч. | 2.17 | 1.64 | 1.44 | 1.67 | 1.78 |
Числит. | 0.84 | 1.24 | 1.16 | 0.92 | 0.75 |
Числит-прилаг. | 0.18 | 0.26 | 0.41 | 0.28 | 0.33 |
Междомет. | 0.11 | 0.12 | 0.10 | 0.17 | 0.09 |
Часть комп. сложн. слова | 0.02 | 0.05 | 0.10 | 0.03 | 0.00 |
Последние комментарии
16 часов 31 минут назад
21 часов 35 минут назад
1 день 5 часов назад
1 день 7 часов назад
1 день 8 часов назад
2 дней 19 часов назад