Лингвистический анализ: Собрание сочинений. Том третий (Ярослав Гашек)
Общая статистика
Длина текста | 921203 знаков |
Длина диалогов | 211320 знаков |
Слов в произведении (СВП) | 139505 слов |
Приблизительно страниц | 512 стр. |
Средняя длина слова | 5.29 знаков |
Предложений в произведении (ПВП) | 9547 предл. |
Средняя длина предложения (СДП) | 93.61 знаков |
Доля диалогов в тексте | 22.94 % |
Доля авторского текста | 77.06 % |
СДП диалогов | 88.39 знаков |
СДП авторского текста | 104.19 знаков |
|
Максимальный фрагмент авторского текста - 13817 знаков (в страницах - примерно 8, начинается где-то с 116 страницы) |
Активный словарный запас
Использовано уникальных слов | 32408 | |
Активный словарный запас (АСЗ) | 30354 | |
Активный не словарный запас (АНСЗ) | 2054 | |
Удельный АСЗ на 3000 слов текста | 1576.65 | 397522 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4320.53 | 355167 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 25712.87 | 57774 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1788) наблюдается примерно на 426 странице |
Минимальный УАСЗ-3000 (1412) наблюдается примерно на 15 странице |
|
Буквы и знаки препинания
Всего букв | 734214 букв |
Всего знаков препинания | 30557 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 16514 | 118.38 |
. | 9201 | 65.95 |
- | 1563 | 11.20 |
? | 550 | 3.94 |
! | 921 | 6.60 |
... | 0 | 0.00 |
!.. | 17 | 0.12 |
?.. | 6 | 0.04 |
!!! | 0 | 0.00 |
?! | 10 | 0.07 |
" | 0 | 0.00 |
() | 315 | 2.26 |
: | 1276 | 9.15 |
; | 184 | 1.32 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 61417 | 8.36 |
Б | 12648 | 1.72 |
В | 33174 | 4.52 |
Г | 14366 | 1.96 |
Д | 23168 | 3.16 |
Е-Ё | 60617 | 8.26 |
Ж | 14366 | 1.96 |
З | 12480 | 1.70 |
И-Й | 58773 | 8.00 |
К | 27823 | 3.79 |
Л | 35352 | 4.81 |
М | 22226 | 3.03 |
Н | 45551 | 6.20 |
О | 81000 | 11.03 |
П | 22275 | 3.03 |
Р | 34144 | 4.65 |
С | 38448 | 5.24 |
Т | 42829 | 5.83 |
У | 21237 | 2.89 |
Ф | 1315 | 0.18 |
Х | 6550 | 0.89 |
Ц | 3536 | 0.48 |
Ч | 11358 | 1.55 |
Ш | 7082 | 0.96 |
Щ | 2440 | 0.33 |
Ь-Ъ | 13224 | 1.80 |
Ы | 13166 | 1.79 |
Э | 2233 | 0.30 |
Ю | 4188 | 0.57 |
Я | 14608 | 1.99 |
|
Части речи
Определенных частей речи (ОЧР) | 138503 слов |
Не определенных частей речи (НОЧР) | 1002 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 38902 | 28.087 |
Глаг. | 13762 | 18.078 |
Мест.-сущ. | 13762 | 9.936 |
Предл. | 10168 | 11.774 |
Союз | 11701 | 8 |
Прилаг. | 10168 | 7.341 |
Нареч. | 7117 | 5.139 |
Местоим-прилаг. | 6246 | 4.510 |
Частица | 5099 | 3.682 |
Местоим. нареч. | 2570 | 1.856 |
Числит. | 1109 | 0.801 |
Числит-прилаг. | 279 | 0.201 |
Междомет. | 189 | 0.136 |
Часть комп. сложн. слова | 14 | 0.010 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 62.10 | 55.29 | 20.66 | 42.94 | 39.25 | 17.48 | 14.09 | 11.68 | 8.25 | 6.32 | 1.64 | 0.53 | 0.57 | 0.06 |
Глаг. | 36.80 | 20.14 | 22.66 | 40.19 | 18.81 | 11.74 | 10.03 | 7.89 | 6.79 | 3.69 | 1.54 | 0.19 | 0.31 | 0.01 |
Мест.-сущ. | 13.70 | 33.82 | 6.30 | 9.65 | 6.86 | 5.68 | 9.21 | 3.26 | 7.89 | 2.27 | 0.54 | 0.06 | 0.13 | 0.00 |
Предл. | 63.31 | 1.60 | 18.52 | 0.60 | 1.01 | 16.32 | 0.65 | 12.65 | 0.11 | 0.09 | 1.92 | 0.90 | 0.04 | 0.02 |
Союз | 13.87 | 19.55 | 14.83 | 9.14 | 3.88 | 4.11 | 6.80 | 3.96 | 4.88 | 2.84 | 0.45 | 0.13 | 0.04 | 0.00 |
Прилаг. | 53.27 | 4.04 | 1.44 | 2.20 | 3.68 | 5.89 | 0.90 | 0.76 | 0.63 | 0.32 | 0.21 | 0.01 | 0.06 | 0.00 |
Нареч. | 4.42 | 19.39 | 4.22 | 5.29 | 4.67 | 3.79 | 3.84 | 1.43 | 3.07 | 0.71 | 0.52 | 0.01 | 0.02 | 0.00 |
Местоим-прилаг. | 20.85 | 5.73 | 3.68 | 2.38 | 1.35 | 5.30 | 1.60 | 1.23 | 1.68 | 0.82 | 0.37 | 0.08 | 0.02 | 0.00 |
Частица | 3.75 | 16.40 | 3.63 | 3.42 | 1.73 | 1.44 | 2.32 | 1.38 | 1.46 | 1.03 | 0.20 | 0.03 | 0.01 | 0.01 |
Местоим. нареч. | 1.68 | 4.10 | 2.92 | 1.61 | 2.76 | 0.92 | 1.75 | 0.51 | 1.81 | 0.39 | 0.08 | 0.01 | 0.01 | 0.00 |
Числит. | 5.59 | 0.39 | 0.15 | 0.19 | 0.28 | 0.45 | 0.12 | 0.12 | 0.07 | 0.04 | 0.53 | 0.06 | 0.00 | 0.00 |
Числит-прилаг. | 1.25 | 0.15 | 0.09 | 0.09 | 0.10 | 0.15 | 0.04 | 0.03 | 0.09 | 0.01 | 0.01 | 0.01 | 0.00 | 0.00 |
Междомет. | 0.25 | 0.17 | 0.24 | 0.04 | 0.10 | 0.09 | 0.03 | 0.19 | 0.08 | 0.02 | 0.00 | 0.00 | 0.14 | 0.00 |
Часть комп. сложн. слова | 0.04 | 0.00 | 0.01 | 0.00 | 0.01 | 0.04 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 18.09 | 23.16 | 24.46 | 25.62 | 28.10 |
Глаг. | 11.41 | 22.96 | 23.24 | 20.98 | 19.24 |
Мест.-сущ. | 15.41 | 15.24 | 12.77 | 11.81 | 9.89 |
Предл. | 13.55 | 8.08 | 10.47 | 12.23 | 12.06 |
Союз | 14.99 | 4.86 | 5.86 | 7.03 | 7.98 |
Прилаг. | 4.65 | 5.13 | 6.41 | 6.96 | 7.32 |
Нареч. | 7.44 | 6.64 | 5.82 | 5.43 | 4.78 |
Местоим-прилаг. | 3.80 | 5.49 | 3.83 | 3.89 | 4.29 |
Частица | 4.51 | 5.08 | 4.18 | 3.60 | 3.49 |
Местоим. нареч. | 4.41 | 2.18 | 1.72 | 1.46 | 1.64 |
Числит. | 0.75 | 0.73 | 0.77 | 0.78 | 0.87 |
Числит-прилаг. | 0.24 | 0.32 | 0.27 | 0.16 | 0.25 |
Междомет. | 0.75 | 0.15 | 0.18 | 0.05 | 0.08 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.01 | 0.01 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 28.31 | 27.79 | 27.72 | 27.69 | 28.60 |
Глаг. | 18.85 | 17.72 | 18.03 | 17.88 | 17.45 |
Мест.-сущ. | 9.54 | 8.71 | 8.66 | 8.86 | 8.54 |
Предл. | 12.51 | 12.10 | 12.04 | 11.59 | 11.98 |
Союз | 9.28 | 9.58 | 9.66 | 9.87 | 9.38 |
Прилаг. | 7.18 | 7.89 | 7.87 | 8.19 | 8.30 |
Нареч. | 4.10 | 4.91 | 5.13 | 4.72 | 4.86 |
Местоим-прилаг. | 4.45 | 5.00 | 4.65 | 4.71 | 4.45 |
Частица | 3.06 | 3.51 | 3.40 | 3.59 | 3.80 |
Местоим. нареч. | 1.66 | 1.75 | 1.68 | 1.79 | 1.75 |
Числит. | 0.82 | 0.79 | 0.92 | 0.87 | 0.61 |
Числит-прилаг. | 0.15 | 0.22 | 0.14 | 0.18 | 0.16 |
Междомет. | 0.09 | 0.03 | 0.11 | 0.05 | 0.09 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.04 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 26.72 | 26.81 | 28.88 | 27.52 | 27.85 |
Глаг. | 17.40 | 17.25 | 17.73 | 17.38 | 17.42 |
Мест.-сущ. | 8.97 | 8.54 | 8.67 | 8.82 | 8.95 |
Предл. | 13.69 | 13.09 | 12.51 | 13.14 | 12.63 |
Союз | 9.17 | 9.18 | 8.58 | 9.43 | 9.14 |
Прилаг. | 7.90 | 8.41 | 8.39 | 7.29 | 7.97 |
Нареч. | 5.25 | 4.29 | 4.42 | 4.93 | 4.24 |
Местоим-прилаг. | 4.80 | 5.41 | 4.49 | 4.85 | 5.02 |
Частица | 3.35 | 4.02 | 3.40 | 3.84 | 3.60 |
Местоим. нареч. | 1.66 | 1.67 | 1.76 | 2.01 | 2.12 |
Числит. | 0.76 | 1.10 | 0.83 | 0.61 | 0.89 |
Числит-прилаг. | 0.20 | 0.17 | 0.21 | 0.10 | 0.11 |
Междомет. | 0.14 | 0.04 | 0.12 | 0.10 | 0.06 |
Часть комп. сложн. слова | 0.00 | 0.02 | 0.02 | 0.00 | 0.00 |
Последние комментарии
4 минут 8 секунд назад
9 минут 27 секунд назад
1 час 38 минут назад
1 час 41 минут назад
1 час 48 минут назад
1 час 59 минут назад