Лингвистический анализ: Блокада Ленинграда. Дневники 1941-1944 годов ( Сборник)
Общая статистика
Длина текста | 1089632 знаков |
Длина диалогов | 30564 знаков |
Слов в произведении (СВП) | 159968 слов |
Приблизительно страниц | 606 стр. |
Средняя длина слова | 5.42 знаков |
Предложений в произведении (ПВП) | 17758 предл. |
Средняя длина предложения (СДП) | 58.40 знаков |
Доля диалогов в тексте | 2.80 % |
Доля авторского текста | 97.2 % |
СДП диалогов | 60.13 знаков |
СДП авторского текста | 61.70 знаков |
|
Максимальный фрагмент авторского текста - 156457 знаков (в страницах - примерно 87, начинается где-то с 537 страницы) |
Активный словарный запас
Использовано уникальных слов | 31167 | |
Активный словарный запас (АСЗ) | 30270 | |
Активный не словарный запас (АНСЗ) | 897 | |
Удельный АСЗ на 3000 слов текста | 1595.25 | 438080 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4235.13 | 386870 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 22965.27 | 59613 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1865) наблюдается примерно на 579 странице |
Минимальный УАСЗ-3000 (1263) наблюдается примерно на 148 странице |
|
Буквы и знаки препинания
Всего букв | 864501 букв |
Всего знаков препинания | 37908 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 14958 | 93.51 |
. | 17656 | 110.37 |
- | 1873 | 11.71 |
? | 336 | 2.10 |
! | 484 | 3.03 |
... | 0 | 0.00 |
!.. | 2 | 0.01 |
?.. | 0 | 0.00 |
!!! | 4 | 0.03 |
?! | 16 | 0.10 |
" | 0 | 0.00 |
() | 411 | 2.57 |
: | 792 | 4.95 |
; | 1376 | 8.60 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 72601 | 8.40 |
Б | 15940 | 1.84 |
В | 40333 | 4.67 |
Г | 15959 | 1.85 |
Д | 29692 | 3.43 |
Е-Ё | 70594 | 8.17 |
Ж | 15959 | 1.85 |
З | 13667 | 1.58 |
И-Й | 70327 | 8.13 |
К | 28090 | 3.25 |
Л | 39358 | 4.55 |
М | 26372 | 3.05 |
Н | 57047 | 6.60 |
О | 97284 | 11.25 |
П | 24509 | 2.84 |
Р | 42649 | 4.93 |
С | 44305 | 5.12 |
Т | 50707 | 5.87 |
У | 22599 | 2.61 |
Ф | 1795 | 0.21 |
Х | 8893 | 1.03 |
Ц | 3696 | 0.43 |
Ч | 12593 | 1.46 |
Ш | 6879 | 0.80 |
Щ | 3384 | 0.39 |
Ь-Ъ | 15274 | 1.77 |
Ы | 16153 | 1.87 |
Э | 1935 | 0.22 |
Ю | 5477 | 0.63 |
Я | 17813 | 2.06 |
|
Части речи
Определенных частей речи (ОЧР) | 158133 слов |
Не определенных частей речи (НОЧР) | 1835 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 54994 | 34.777 |
Глаг. | 9221 | 16.852 |
Мест.-сущ. | 9221 | 5.831 |
Предл. | 12558 | 12.325 |
Союз | 11968 | 8 |
Прилаг. | 12558 | 7.941 |
Нареч. | 8495 | 5.372 |
Местоим-прилаг. | 5779 | 3.655 |
Частица | 5366 | 3.393 |
Местоим. нареч. | 1740 | 1.100 |
Числит. | 1224 | 0.774 |
Числит-прилаг. | 500 | 0.316 |
Междомет. | 124 | 0.078 |
Часть комп. сложн. слова | 25 | 0.016 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 105.80 | 63.74 | 14.91 | 56.03 | 38.07 | 25.19 | 16.81 | 10.36 | 10.18 | 3.64 | 1.72 | 0.82 | 0.42 | 0.08 |
Глаг. | 40.78 | 21.02 | 10.70 | 37.76 | 16.06 | 13.30 | 11.90 | 7.36 | 5.23 | 2.26 | 1.62 | 0.44 | 0.08 | 0.03 |
Мест.-сущ. | 8.32 | 20.17 | 3.09 | 5.55 | 3.74 | 3.37 | 5.76 | 1.57 | 5.29 | 1.01 | 0.35 | 0.08 | 0.03 | 0.01 |
Предл. | 77.06 | 2.35 | 11.63 | 1.88 | 0.99 | 15.99 | 0.72 | 8.82 | 0.20 | 0.06 | 2.22 | 1.26 | 0.06 | 0.02 |
Союз | 19.23 | 14.92 | 8.58 | 6.98 | 2.94 | 5.41 | 6.68 | 3.74 | 4.45 | 1.97 | 0.48 | 0.22 | 0.07 | 0.02 |
Прилаг. | 57.49 | 3.97 | 1.10 | 2.94 | 4.57 | 5.98 | 1.37 | 0.70 | 0.73 | 0.29 | 0.16 | 0.08 | 0.04 | 0.01 |
Нареч. | 6.99 | 17.96 | 2.94 | 6.08 | 4.22 | 3.86 | 5.38 | 1.59 | 3.34 | 0.75 | 0.51 | 0.08 | 0.02 | 0.00 |
Местоим-прилаг. | 18.05 | 5.22 | 2.00 | 1.66 | 1.14 | 3.82 | 1.65 | 0.81 | 1.61 | 0.30 | 0.20 | 0.08 | 0.01 | 0.00 |
Частица | 4.86 | 15.75 | 1.80 | 3.19 | 1.40 | 1.28 | 2.21 | 1.13 | 1.69 | 0.47 | 0.11 | 0.03 | 0.01 | 0.00 |
Местоим. нареч. | 0.84 | 2.69 | 1.39 | 0.75 | 2.20 | 0.40 | 1.06 | 0.28 | 1.09 | 0.21 | 0.03 | 0.04 | 0.01 | 0.00 |
Числит. | 5.68 | 0.45 | 0.09 | 0.26 | 0.15 | 0.47 | 0.11 | 0.09 | 0.04 | 0.03 | 0.31 | 0.03 | 0.01 | 0.00 |
Числит-прилаг. | 2.23 | 0.20 | 0.05 | 0.15 | 0.13 | 0.19 | 0.06 | 0.03 | 0.06 | 0.01 | 0.03 | 0.02 | 0.00 | 0.00 |
Междомет. | 0.41 | 0.08 | 0.03 | 0.03 | 0.07 | 0.03 | 0.01 | 0.06 | 0.02 | 0.00 | 0.01 | 0.00 | 0.04 | 0.00 |
Часть комп. сложн. слова | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.11 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 27.44 | 31.77 | 30.19 | 31.53 | 32.19 |
Глаг. | 15.50 | 21.11 | 20.60 | 19.29 | 17.48 |
Мест.-сущ. | 8.99 | 7.78 | 6.18 | 5.89 | 5.62 |
Предл. | 17.57 | 10.78 | 12.74 | 12.70 | 12.65 |
Союз | 7.18 | 4.49 | 6.26 | 7.12 | 8.33 |
Прилаг. | 4.60 | 6.85 | 8.05 | 8.57 | 9.19 |
Нареч. | 8.17 | 6.67 | 6.41 | 5.07 | 4.83 |
Местоим-прилаг. | 3.92 | 4.06 | 3.50 | 3.74 | 3.64 |
Частица | 3.67 | 4.12 | 3.91 | 3.86 | 3.68 |
Местоим. нареч. | 1.97 | 0.94 | 0.87 | 0.81 | 0.91 |
Числит. | 0.42 | 0.85 | 0.91 | 1.08 | 1.13 |
Числит-прилаг. | 0.34 | 0.52 | 0.33 | 0.29 | 0.31 |
Междомет. | 0.21 | 0.05 | 0.04 | 0.04 | 0.02 |
Часть комп. сложн. слова | 0.02 | 0.01 | 0.00 | 0.01 | 0.01 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 32.18 | 32.16 | 32.21 | 32.12 | 32.21 |
Глаг. | 16.43 | 16.00 | 15.54 | 15.82 | 15.21 |
Мест.-сущ. | 5.14 | 5.62 | 5.18 | 5.27 | 5.45 |
Предл. | 13.57 | 14.05 | 14.19 | 13.17 | 13.50 |
Союз | 9.08 | 8.94 | 8.89 | 9.45 | 9.21 |
Прилаг. | 9.17 | 9.21 | 9.30 | 9.94 | 9.63 |
Нареч. | 4.78 | 4.63 | 4.21 | 4.66 | 4.48 |
Местоим-прилаг. | 3.65 | 3.65 | 4.11 | 3.92 | 3.95 |
Частица | 3.52 | 3.39 | 3.94 | 3.52 | 3.93 |
Местоим. нареч. | 1.12 | 1.04 | 1.19 | 0.91 | 1.30 |
Числит. | 1.09 | 1.05 | 0.94 | 0.92 | 0.80 |
Числит-прилаг. | 0.25 | 0.23 | 0.27 | 0.24 | 0.32 |
Междомет. | 0.01 | 0.02 | 0.01 | 0.03 | 0.02 |
Часть комп. сложн. слова | 0.01 | 0.01 | 0.02 | 0.03 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 32.23 | 32.85 | 32.57 | 32.83 | 32.05 |
Глаг. | 15.50 | 15.46 | 15.80 | 14.76 | 14.96 |
Мест.-сущ. | 5.57 | 5.19 | 4.84 | 4.61 | 4.55 |
Предл. | 14.03 | 13.55 | 13.53 | 13.84 | 14.22 |
Союз | 8.64 | 8.47 | 9.16 | 9.37 | 9.61 |
Прилаг. | 9.45 | 10.33 | 10.22 | 9.89 | 10.18 |
Нареч. | 4.29 | 4.52 | 4.05 | 4.41 | 3.44 |
Местоим-прилаг. | 4.20 | 3.97 | 3.53 | 3.40 | 4.42 |
Частица | 3.76 | 3.39 | 3.75 | 4.01 | 4.21 |
Местоим. нареч. | 0.92 | 1.05 | 1.23 | 1.41 | 1.21 |
Числит. | 0.88 | 0.92 | 0.91 | 1.01 | 0.67 |
Числит-прилаг. | 0.46 | 0.21 | 0.35 | 0.40 | 0.40 |
Междомет. | 0.06 | 0.02 | 0.05 | 0.03 | 0.07 |
Часть комп. сложн. слова | 0.00 | 0.06 | 0.00 | 0.03 | 0.00 |
Последние комментарии
1 день 5 часов назад
1 день 11 часов назад
1 день 11 часов назад
1 день 12 часов назад
1 день 12 часов назад
1 день 12 часов назад