Лингвистический анализ: Случай Эренбурга (Бенедикт Сарнов)
Общая статистика
Длина текста | 727530 знаков |
Длина диалогов | 54189 знаков |
Слов в произведении (СВП) | 110303 слов |
Приблизительно страниц | 405 стр. |
Средняя длина слова | 5.28 знаков |
Предложений в произведении (ПВП) | 7041 предл. |
Средняя длина предложения (СДП) | 100.42 знаков |
Доля диалогов в тексте | 7.45 % |
Доля авторского текста | 92.55 % |
СДП диалогов | 83.15 знаков |
СДП авторского текста | 111.77 знаков |
|
Максимальный фрагмент авторского текста - 23297 знаков (в страницах - примерно 13, начинается где-то с 287 страницы) |
Активный словарный запас
Использовано уникальных слов | 22959 | |
Активный словарный запас (АСЗ) | 22275 | |
Активный не словарный запас (АНСЗ) | 684 | |
Удельный АСЗ на 3000 слов текста | 1447.67 | 123724 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3812.80 | 127207 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 21470.86 | 36574 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1659) наблюдается примерно на 392 странице |
Минимальный УАСЗ-3000 (1315) наблюдается примерно на 297 странице |
|
Буквы и знаки препинания
Всего букв | 581624 букв |
Всего знаков препинания | 24295 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 13548 | 122.83 |
. | 6773 | 61.40 |
- | 1122 | 10.17 |
? | 490 | 4.44 |
! | 387 | 3.51 |
... | 0 | 0.00 |
!.. | 24 | 0.22 |
?.. | 31 | 0.28 |
!!! | 1 | 0.01 |
?! | 7 | 0.06 |
" | 0 | 0.00 |
() | 795 | 7.21 |
: | 1068 | 9.68 |
; | 49 | 0.44 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 45530 | 7.83 |
Б | 9764 | 1.68 |
В | 26573 | 4.57 |
Г | 11782 | 2.03 |
Д | 15729 | 2.70 |
Е-Ё | 49444 | 8.50 |
Ж | 11782 | 2.03 |
З | 9121 | 1.57 |
И-Й | 48428 | 8.33 |
К | 20184 | 3.47 |
Л | 25728 | 4.42 |
М | 20215 | 3.48 |
Н | 38757 | 6.66 |
О | 66405 | 11.42 |
П | 14554 | 2.50 |
Р | 25987 | 4.47 |
С | 31721 | 5.45 |
Т | 37329 | 6.42 |
У | 15443 | 2.66 |
Ф | 1093 | 0.19 |
Х | 5219 | 0.90 |
Ц | 2207 | 0.38 |
Ч | 8993 | 1.55 |
Ш | 4172 | 0.72 |
Щ | 1833 | 0.32 |
Ь-Ъ | 10642 | 1.83 |
Ы | 10722 | 1.84 |
Э | 3888 | 0.67 |
Ю | 3453 | 0.59 |
Я | 11275 | 1.94 |
|
Части речи
Определенных частей речи (ОЧР) | 110188 слов |
Не определенных частей речи (НОЧР) | 115 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 28037 | 25.445 |
Глаг. | 11286 | 15.987 |
Мест.-сущ. | 11286 | 10.242 |
Предл. | 8496 | 10.194 |
Союз | 10010 | 9 |
Прилаг. | 8496 | 7.710 |
Нареч. | 6239 | 5.662 |
Местоим-прилаг. | 7710 | 6.997 |
Частица | 6624 | 6.012 |
Местоим. нареч. | 2073 | 1.881 |
Числит. | 471 | 0.427 |
Числит-прилаг. | 342 | 0.310 |
Междомет. | 38 | 0.034 |
Часть комп. сложн. слова | 13 | 0.012 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 60.59 | 42.12 | 21.07 | 34.55 | 35.40 | 15.07 | 12.50 | 15.36 | 11.51 | 4.60 | 0.74 | 0.74 | 0.15 | 0.05 |
Глаг. | 25.13 | 18.65 | 20.25 | 29.89 | 19.60 | 9.55 | 10.46 | 10.70 | 11.01 | 3.39 | 0.65 | 0.48 | 0.08 | 0.04 |
Мест.-сущ. | 15.89 | 29.01 | 6.10 | 8.66 | 8.67 | 6.82 | 9.11 | 4.86 | 9.81 | 3.09 | 0.29 | 0.08 | 0.03 | 0.01 |
Предл. | 42.63 | 1.53 | 20.88 | 0.54 | 1.36 | 12.28 | 0.82 | 19.71 | 0.24 | 0.09 | 0.91 | 0.94 | 0.01 | 0.00 |
Союз | 16.54 | 14.58 | 13.42 | 9.69 | 4.94 | 5.63 | 7.25 | 6.05 | 9.19 | 3.05 | 0.29 | 0.19 | 0.02 | 0.00 |
Прилаг. | 49.00 | 3.58 | 2.85 | 2.93 | 5.85 | 7.09 | 1.60 | 2.31 | 1.18 | 0.49 | 0.13 | 0.09 | 0.00 | 0.01 |
Нареч. | 3.20 | 18.90 | 4.07 | 5.06 | 5.33 | 5.40 | 5.64 | 2.07 | 5.71 | 0.92 | 0.25 | 0.07 | 0.00 | 0.01 |
Местоим-прилаг. | 30.19 | 5.54 | 7.03 | 3.00 | 2.30 | 10.26 | 2.22 | 4.42 | 3.36 | 1.05 | 0.33 | 0.25 | 0.02 | 0.00 |
Частица | 5.95 | 22.02 | 4.25 | 5.55 | 3.68 | 3.39 | 4.66 | 3.37 | 5.02 | 1.72 | 0.34 | 0.14 | 0.03 | 0.00 |
Местоим. нареч. | 1.13 | 3.58 | 2.11 | 1.72 | 3.16 | 1.04 | 2.13 | 0.69 | 2.86 | 0.33 | 0.05 | 0.00 | 0.01 | 0.00 |
Числит. | 2.32 | 0.16 | 0.15 | 0.23 | 0.30 | 0.24 | 0.13 | 0.19 | 0.12 | 0.03 | 0.31 | 0.10 | 0.00 | 0.00 |
Числит-прилаг. | 1.70 | 0.16 | 0.21 | 0.12 | 0.25 | 0.25 | 0.05 | 0.21 | 0.06 | 0.07 | 0.00 | 0.02 | 0.00 | 0.00 |
Междомет. | 0.11 | 0.04 | 0.03 | 0.00 | 0.02 | 0.01 | 0.05 | 0.04 | 0.05 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 |
Часть комп. сложн. слова | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 | 0.07 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 14.81 | 18.18 | 21.66 | 22.41 | 24.41 |
Глаг. | 9.90 | 18.51 | 17.48 | 18.34 | 18.22 |
Мест.-сущ. | 11.41 | 13.14 | 13.18 | 12.51 | 10.79 |
Предл. | 11.04 | 9.16 | 9.89 | 10.05 | 9.57 |
Союз | 26.30 | 7.59 | 6.98 | 8.21 | 8.54 |
Прилаг. | 3.28 | 5.02 | 5.92 | 6.67 | 6.89 |
Нареч. | 6.62 | 6.91 | 6.42 | 6.04 | 6.23 |
Местоим-прилаг. | 5.03 | 8.33 | 7.50 | 6.97 | 7.10 |
Частица | 7.37 | 9.11 | 7.64 | 6.14 | 5.60 |
Местоим. нареч. | 3.38 | 3.02 | 2.63 | 1.79 | 1.88 |
Числит. | 0.26 | 0.46 | 0.28 | 0.53 | 0.54 |
Числит-прилаг. | 0.44 | 0.53 | 0.41 | 0.26 | 0.21 |
Междомет. | 0.10 | 0.03 | 0.00 | 0.05 | 0.00 |
Часть комп. сложн. слова | 0.04 | 0.00 | 0.02 | 0.02 | 0.02 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 24.79 | 24.22 | 24.06 | 25.07 | 25.91 |
Глаг. | 17.05 | 17.05 | 16.24 | 16.17 | 17.06 |
Мест.-сущ. | 10.92 | 10.35 | 9.78 | 10.55 | 9.44 |
Предл. | 10.09 | 10.84 | 11.47 | 10.35 | 11.10 |
Союз | 7.74 | 8.77 | 8.67 | 8.41 | 8.12 |
Прилаг. | 6.94 | 7.83 | 8.01 | 8.39 | 7.91 |
Нареч. | 5.85 | 5.80 | 5.96 | 5.12 | 5.24 |
Местоим-прилаг. | 7.89 | 6.68 | 7.32 | 7.71 | 7.45 |
Частица | 5.82 | 6.07 | 6.05 | 6.06 | 5.67 |
Местоим. нареч. | 2.04 | 1.62 | 1.73 | 1.57 | 1.39 |
Числит. | 0.57 | 0.45 | 0.31 | 0.36 | 0.46 |
Числит-прилаг. | 0.28 | 0.23 | 0.38 | 0.25 | 0.19 |
Междомет. | 0.04 | 0.06 | 0.02 | 0.00 | 0.02 |
Часть комп. сложн. слова | 0.00 | 0.02 | 0.00 | 0.00 | 0.02 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 26.28 | 26.39 | 25.67 | 26.61 | 25.36 |
Глаг. | 14.34 | 15.13 | 14.48 | 16.23 | 15.03 |
Мест.-сущ. | 10.34 | 9.06 | 10.25 | 8.70 | 9.52 |
Предл. | 11.84 | 10.23 | 10.91 | 10.35 | 11.70 |
Союз | 7.87 | 9.11 | 9.00 | 7.63 | 8.15 |
Прилаг. | 8.72 | 8.64 | 8.97 | 8.86 | 9.03 |
Нареч. | 5.55 | 5.15 | 5.49 | 4.87 | 4.78 |
Местоим-прилаг. | 6.50 | 7.44 | 6.81 | 8.05 | 7.80 |
Частица | 5.57 | 6.63 | 6.06 | 5.91 | 5.94 |
Местоим. нареч. | 1.81 | 1.34 | 1.50 | 1.79 | 2.04 |
Числит. | 0.72 | 0.50 | 0.48 | 0.62 | 0.39 |
Числит-прилаг. | 0.46 | 0.28 | 0.36 | 0.36 | 0.18 |
Междомет. | 0.00 | 0.08 | 0.03 | 0.03 | 0.07 |
Часть комп. сложн. слова | 0.00 | 0.03 | 0.00 | 0.00 | 0.04 |
Последние комментарии
2 часов 28 минут назад
2 часов 29 минут назад
2 часов 37 минут назад
2 часов 41 минут назад
10 часов 23 минут назад
11 часов 4 минут назад