Лингвистический анализ: Отмытый роман Пастернака: «Доктор Живаго» между КГБ и ЦРУ (Иван Толстой)
Общая статистика
Длина текста | 807125 знаков |
Длина диалогов | 12094 знаков |
Слов в произведении (СВП) | 112521 слов |
Приблизительно страниц | 449 стр. |
Средняя длина слова | 5.76 знаков |
Предложений в произведении (ПВП) | 7842 предл. |
Средняя длина предложения (СДП) | 99.99 знаков |
Доля диалогов в тексте | 1.50 % |
Доля авторского текста | 98.5 % |
СДП диалогов | 52.76 знаков |
СДП авторского текста | 97.45 знаков |
|
Максимальный фрагмент авторского текста - 111419 знаков (в страницах - примерно 62, начинается где-то с 125 страницы) |
Активный словарный запас
Использовано уникальных слов | 25524 | |
Активный словарный запас (АСЗ) | 24087 | |
Активный не словарный запас (АНСЗ) | 1437 | |
Удельный АСЗ на 3000 слов текста | 1592.60 | 403729 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4257.22 | 350125 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 23613.47 | 29357 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1826) наблюдается примерно на 446 странице |
Минимальный УАСЗ-3000 (1405) наблюдается примерно на 32 странице |
|
Буквы и знаки препинания
Всего букв | 643869 букв |
Всего знаков препинания | 24783 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 12230 | 108.69 |
. | 7668 | 68.15 |
- | 1070 | 9.51 |
? | 369 | 3.28 |
! | 175 | 1.56 |
... | 273 | 2.43 |
!.. | 4 | 0.04 |
?.. | 3 | 0.03 |
!!! | 1 | 0.01 |
?! | 1 | 0.01 |
" | 18 | 0.16 |
() | 1663 | 14.78 |
: | 1096 | 9.74 |
; | 212 | 1.88 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 52976 | 8.23 |
Б | 9508 | 1.48 |
В | 30151 | 4.68 |
Г | 11548 | 1.79 |
Д | 18831 | 2.92 |
Е-Ё | 55708 | 8.65 |
Ж | 11548 | 1.79 |
З | 10124 | 1.57 |
И-Й | 58009 | 9.01 |
К | 23074 | 3.58 |
Л | 28467 | 4.42 |
М | 20619 | 3.20 |
Н | 43113 | 6.70 |
О | 68519 | 10.64 |
П | 19130 | 2.97 |
Р | 31746 | 4.93 |
С | 37281 | 5.79 |
Т | 39187 | 6.09 |
У | 15390 | 2.39 |
Ф | 2074 | 0.32 |
Х | 5016 | 0.78 |
Ц | 2825 | 0.44 |
Ч | 8790 | 1.37 |
Ш | 3746 | 0.58 |
Щ | 1931 | 0.30 |
Ь-Ъ | 11119 | 1.73 |
Ы | 10343 | 1.61 |
Э | 2543 | 0.39 |
Ю | 3900 | 0.61 |
Я | 12095 | 1.88 |
|
Части речи
Определенных частей речи (ОЧР) | 111638 слов |
Не определенных частей речи (НОЧР) | 883 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 39850 | 35.696 |
Глаг. | 8173 | 13.908 |
Мест.-сущ. | 8173 | 7.321 |
Предл. | 10502 | 11.659 |
Союз | 8280 | 7 |
Прилаг. | 10502 | 9.407 |
Нареч. | 4574 | 4.097 |
Местоим-прилаг. | 5115 | 4.582 |
Частица | 4456 | 3.991 |
Местоим. нареч. | 1229 | 1.101 |
Числит. | 500 | 0.448 |
Числит-прилаг. | 367 | 0.329 |
Междомет. | 29 | 0.026 |
Часть комп. сложн. слова | 20 | 0.018 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 125.67 | 49.79 | 17.32 | 55.16 | 36.48 | 27.32 | 13.11 | 13.47 | 11.97 | 4.38 | 0.91 | 1.15 | 0.13 | 0.09 |
Глаг. | 31.68 | 13.85 | 14.31 | 30.11 | 13.29 | 12.59 | 6.33 | 7.66 | 6.32 | 1.69 | 0.79 | 0.40 | 0.03 | 0.02 |
Мест.-сущ. | 12.93 | 21.87 | 3.97 | 6.19 | 5.87 | 5.60 | 5.98 | 2.57 | 6.57 | 1.16 | 0.22 | 0.24 | 0.01 | 0.02 |
Предл. | 61.96 | 1.71 | 15.66 | 1.33 | 1.18 | 18.06 | 1.18 | 12.96 | 0.31 | 0.09 | 1.25 | 0.86 | 0.01 | 0.03 |
Союз | 17.79 | 12.66 | 10.36 | 7.46 | 3.00 | 7.40 | 5.12 | 3.61 | 4.92 | 1.48 | 0.22 | 0.13 | 0.01 | 0.00 |
Прилаг. | 67.65 | 3.70 | 1.61 | 3.61 | 5.51 | 8.41 | 1.10 | 0.96 | 0.82 | 0.39 | 0.21 | 0.04 | 0.04 | 0.03 |
Нареч. | 3.81 | 13.36 | 2.27 | 4.68 | 3.64 | 4.61 | 3.39 | 1.25 | 3.01 | 0.59 | 0.30 | 0.06 | 0.00 | 0.00 |
Местоим-прилаг. | 22.46 | 4.39 | 3.75 | 2.34 | 1.45 | 5.96 | 1.58 | 1.52 | 1.75 | 0.32 | 0.15 | 0.14 | 0.01 | 0.00 |
Частица | 7.07 | 15.59 | 2.44 | 4.49 | 1.46 | 2.50 | 2.18 | 1.50 | 1.76 | 0.65 | 0.19 | 0.08 | 0.01 | 0.00 |
Местоим. нареч. | 0.89 | 1.85 | 1.25 | 0.73 | 1.99 | 0.56 | 0.90 | 0.21 | 2.36 | 0.19 | 0.04 | 0.04 | 0.00 | 0.00 |
Числит. | 3.00 | 0.14 | 0.12 | 0.27 | 0.12 | 0.42 | 0.04 | 0.07 | 0.01 | 0.03 | 0.15 | 0.11 | 0.00 | 0.00 |
Числит-прилаг. | 1.90 | 0.15 | 0.13 | 0.22 | 0.16 | 0.50 | 0.04 | 0.01 | 0.07 | 0.03 | 0.04 | 0.03 | 0.00 | 0.00 |
Междомет. | 0.10 | 0.03 | 0.02 | 0.02 | 0.02 | 0.02 | 0.00 | 0.01 | 0.03 | 0.01 | 0.00 | 0.00 | 0.02 | 0.00 |
Часть комп. сложн. слова | 0.05 | 0.00 | 0.00 | 0.00 | 0.01 | 0.12 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 32.34 | 35.89 | 36.23 | 35.49 | 35.97 |
Глаг. | 8.03 | 15.58 | 16.22 | 17.15 | 16.03 |
Мест.-сущ. | 11.20 | 9.06 | 8.40 | 7.18 | 7.51 |
Предл. | 13.98 | 8.26 | 9.67 | 10.95 | 11.39 |
Союз | 12.95 | 4.96 | 5.73 | 6.08 | 6.23 |
Прилаг. | 5.29 | 6.93 | 8.49 | 9.40 | 8.82 |
Нареч. | 5.36 | 5.01 | 4.73 | 3.83 | 3.95 |
Местоим-прилаг. | 4.32 | 5.11 | 3.78 | 4.03 | 4.63 |
Частица | 3.47 | 6.33 | 4.77 | 3.80 | 3.85 |
Местоим. нареч. | 2.41 | 1.67 | 1.05 | 0.92 | 0.83 |
Числит. | 0.21 | 0.59 | 0.52 | 0.57 | 0.48 |
Числит-прилаг. | 0.27 | 0.59 | 0.38 | 0.55 | 0.27 |
Междомет. | 0.17 | 0.03 | 0.02 | 0.02 | 0.00 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.02 | 0.03 | 0.03 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 35.50 | 36.67 | 35.30 | 34.92 | 33.80 |
Глаг. | 15.04 | 14.17 | 14.30 | 13.96 | 14.06 |
Мест.-сущ. | 6.53 | 6.24 | 6.55 | 7.11 | 7.36 |
Предл. | 12.36 | 11.96 | 11.74 | 12.61 | 12.12 |
Союз | 6.67 | 6.76 | 7.85 | 7.90 | 7.62 |
Прилаг. | 10.00 | 10.02 | 9.96 | 9.95 | 10.33 |
Нареч. | 4.03 | 4.13 | 3.99 | 3.51 | 4.50 |
Местоим-прилаг. | 4.45 | 4.15 | 4.62 | 4.36 | 4.53 |
Частица | 3.76 | 4.26 | 3.93 | 3.99 | 3.82 |
Местоим. нареч. | 0.85 | 0.77 | 0.84 | 0.89 | 1.11 |
Числит. | 0.38 | 0.42 | 0.57 | 0.41 | 0.47 |
Числит-прилаг. | 0.38 | 0.40 | 0.33 | 0.35 | 0.26 |
Междомет. | 0.02 | 0.02 | 0.00 | 0.02 | 0.00 |
Часть комп. сложн. слова | 0.04 | 0.02 | 0.02 | 0.02 | 0.02 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 31.73 | 34.40 | 32.99 | 35.03 | 33.50 |
Глаг. | 14.37 | 14.20 | 15.18 | 12.49 | 13.72 |
Мест.-сущ. | 7.93 | 6.87 | 6.72 | 7.75 | 7.12 |
Предл. | 12.61 | 12.18 | 12.67 | 12.62 | 12.76 |
Союз | 7.82 | 7.72 | 8.97 | 7.72 | 7.76 |
Прилаг. | 10.98 | 10.10 | 9.83 | 10.35 | 11.04 |
Нареч. | 4.05 | 3.89 | 3.56 | 4.28 | 4.27 |
Местоим-прилаг. | 4.26 | 5.28 | 4.42 | 4.64 | 4.16 |
Частица | 4.13 | 4.00 | 3.89 | 3.34 | 3.53 |
Местоим. нареч. | 1.22 | 0.71 | 0.90 | 1.07 | 0.95 |
Числит. | 0.31 | 0.38 | 0.60 | 0.45 | 0.71 |
Числит-прилаг. | 0.54 | 0.27 | 0.21 | 0.23 | 0.42 |
Междомет. | 0.00 | 0.00 | 0.06 | 0.03 | 0.07 |
Часть комп. сложн. слова | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 |
Последние комментарии
1 час 9 минут назад
8 часов 32 минут назад
14 часов 17 минут назад
15 часов 24 минут назад
16 часов 21 минут назад
16 часов 36 минут назад