Лингвистический анализ: Вокруг Петербурга. Заметки наблюдателя (Сергей Глезеров)
Общая статистика
Длина текста | 846025 знаков |
Длина диалогов | 33956 знаков |
Слов в произведении (СВП) | 116793 слов |
Приблизительно страниц | 471 стр. |
Средняя длина слова | 5.91 знаков |
Предложений в произведении (ПВП) | 7000 предл. |
Средняя длина предложения (СДП) | 117.90 знаков |
Доля диалогов в тексте | 4.01 % |
Доля авторского текста | 95.99 % |
СДП диалогов | 114.89 знаков |
СДП авторского текста | 107.89 знаков |
|
Максимальный фрагмент авторского текста - 442137 знаков (в страницах - примерно 246, начинается где-то с 93 страницы) |
Активный словарный запас
Использовано уникальных слов | 28275 | |
Активный словарный запас (АСЗ) | 27203 | |
Активный не словарный запас (АНСЗ) | 1072 | |
Удельный АСЗ на 3000 слов текста | 1640.95 | 470298 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4422.12 | 409483 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 25449.05 | 15874 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1808) наблюдается примерно на 197 странице |
Минимальный УАСЗ-3000 (1463) наблюдается примерно на 310 странице |
|
Буквы и знаки препинания
Всего букв | 689548 букв |
Всего знаков препинания | 21883 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 11379 | 97.43 |
. | 7802 | 66.80 |
- | 1355 | 11.60 |
? | 203 | 1.74 |
! | 154 | 1.32 |
... | 0 | 0.00 |
!.. | 7 | 0.06 |
?.. | 5 | 0.04 |
!!! | 1 | 0.01 |
?! | 2 | 0.02 |
" | 0 | 0.00 |
() | 391 | 3.35 |
: | 531 | 4.55 |
; | 53 | 0.45 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 53644 | 7.78 |
Б | 11231 | 1.63 |
В | 33582 | 4.87 |
Г | 14004 | 2.03 |
Д | 22821 | 3.31 |
Е-Ё | 58974 | 8.55 |
Ж | 14004 | 2.03 |
З | 10510 | 1.52 |
И-Й | 62129 | 9.01 |
К | 24392 | 3.54 |
Л | 30635 | 4.44 |
М | 20851 | 3.02 |
Н | 45221 | 6.56 |
О | 77391 | 11.22 |
П | 18521 | 2.69 |
Р | 34331 | 4.98 |
С | 39438 | 5.72 |
Т | 38691 | 5.61 |
У | 16300 | 2.36 |
Ф | 1741 | 0.25 |
Х | 7883 | 1.14 |
Ц | 3390 | 0.49 |
Ч | 8651 | 1.25 |
Ш | 4704 | 0.68 |
Щ | 2268 | 0.33 |
Ь-Ъ | 11464 | 1.66 |
Ы | 12964 | 1.88 |
Э | 1688 | 0.24 |
Ю | 3680 | 0.53 |
Я | 12542 | 1.82 |
|
Части речи
Определенных частей речи (ОЧР) | 116479 слов |
Не определенных частей речи (НОЧР) | 314 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 43269 | 37.147 |
Глаг. | 5585 | 13.614 |
Мест.-сущ. | 5585 | 4.795 |
Предл. | 13449 | 12.872 |
Союз | 7769 | 7 |
Прилаг. | 13449 | 11.546 |
Нареч. | 5112 | 4.389 |
Местоим-прилаг. | 4632 | 3.977 |
Частица | 2961 | 2.542 |
Местоим. нареч. | 1480 | 1.271 |
Числит. | 789 | 0.677 |
Числит-прилаг. | 340 | 0.292 |
Междомет. | 51 | 0.044 |
Часть комп. сложн. слова | 191 | 0.164 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 113.64 | 60.16 | 14.17 | 63.93 | 38.28 | 37.14 | 15.12 | 12.74 | 7.19 | 5.61 | 1.49 | 0.77 | 0.24 | 1.00 |
Глаг. | 34.86 | 13.62 | 7.00 | 33.04 | 9.50 | 15.96 | 8.30 | 6.02 | 3.77 | 2.41 | 1.18 | 0.39 | 0.03 | 0.06 |
Мест.-сущ. | 10.41 | 15.48 | 1.52 | 4.03 | 3.62 | 3.50 | 3.57 | 1.30 | 3.40 | 0.71 | 0.27 | 0.10 | 0.03 | 0.01 |
Предл. | 72.79 | 2.06 | 11.78 | 0.96 | 0.68 | 23.94 | 0.92 | 11.71 | 0.12 | 0.09 | 2.20 | 1.14 | 0.02 | 0.33 |
Союз | 17.76 | 10.74 | 5.48 | 7.60 | 2.63 | 7.35 | 5.99 | 3.22 | 3.68 | 1.68 | 0.35 | 0.15 | 0.03 | 0.04 |
Прилаг. | 85.69 | 3.51 | 1.06 | 4.44 | 4.88 | 12.56 | 1.29 | 0.72 | 0.47 | 0.43 | 0.14 | 0.08 | 0.03 | 0.16 |
Нареч. | 4.84 | 12.12 | 2.36 | 6.54 | 3.23 | 5.01 | 4.36 | 1.58 | 2.56 | 0.54 | 0.62 | 0.09 | 0.02 | 0.02 |
Местоим-прилаг. | 19.37 | 4.48 | 2.21 | 3.47 | 0.98 | 5.21 | 1.27 | 0.68 | 1.49 | 0.33 | 0.11 | 0.15 | 0.00 | 0.03 |
Частица | 3.42 | 10.05 | 1.10 | 2.61 | 0.98 | 1.84 | 1.72 | 1.28 | 1.56 | 0.65 | 0.17 | 0.03 | 0.01 | 0.00 |
Местоим. нареч. | 1.26 | 3.44 | 1.16 | 1.54 | 1.67 | 0.74 | 1.21 | 0.33 | 1.08 | 0.23 | 0.04 | 0.00 | 0.00 | 0.00 |
Числит. | 4.85 | 0.26 | 0.04 | 0.32 | 0.13 | 0.76 | 0.09 | 0.11 | 0.01 | 0.00 | 0.20 | 0.00 | 0.01 | 0.00 |
Числит-прилаг. | 1.73 | 0.12 | 0.03 | 0.21 | 0.11 | 0.56 | 0.02 | 0.02 | 0.07 | 0.03 | 0.01 | 0.01 | 0.00 | 0.00 |
Междомет. | 0.14 | 0.06 | 0.04 | 0.04 | 0.00 | 0.03 | 0.02 | 0.06 | 0.01 | 0.00 | 0.00 | 0.01 | 0.03 | 0.00 |
Часть комп. сложн. слова | 0.70 | 0.03 | 0.00 | 0.00 | 0.01 | 0.88 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 20.53 | 32.63 | 35.70 | 34.98 | 36.18 |
Глаг. | 9.22 | 16.35 | 17.84 | 16.47 | 15.68 |
Мест.-сущ. | 7.92 | 8.91 | 6.51 | 5.63 | 5.07 |
Предл. | 21.81 | 10.59 | 12.28 | 12.56 | 13.03 |
Союз | 13.65 | 4.01 | 4.56 | 5.55 | 5.52 |
Прилаг. | 5.83 | 8.31 | 8.61 | 11.29 | 11.30 |
Нареч. | 8.23 | 5.43 | 5.35 | 4.73 | 4.09 |
Местоим-прилаг. | 5.05 | 5.79 | 3.78 | 3.95 | 4.01 |
Частица | 3.02 | 4.82 | 3.01 | 2.42 | 2.82 |
Местоим. нареч. | 3.39 | 1.76 | 1.21 | 1.15 | 1.13 |
Числит. | 0.62 | 0.77 | 0.60 | 0.78 | 0.64 |
Числит-прилаг. | 0.41 | 0.59 | 0.40 | 0.34 | 0.35 |
Междомет. | 0.27 | 0.00 | 0.02 | 0.02 | 0.00 |
Часть комп. сложн. слова | 0.03 | 0.06 | 0.15 | 0.12 | 0.16 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 36.94 | 36.50 | 37.13 | 36.27 | 37.02 |
Глаг. | 15.39 | 14.14 | 14.21 | 12.94 | 13.52 |
Мест.-сущ. | 4.51 | 4.40 | 3.61 | 4.53 | 3.91 |
Предл. | 13.36 | 12.56 | 13.28 | 13.66 | 12.64 |
Союз | 6.19 | 6.52 | 6.92 | 7.02 | 7.14 |
Прилаг. | 11.30 | 12.25 | 12.17 | 13.00 | 13.40 |
Нареч. | 4.14 | 3.89 | 3.85 | 3.86 | 3.89 |
Местоим-прилаг. | 3.34 | 4.22 | 4.17 | 3.88 | 4.02 |
Частица | 2.84 | 2.68 | 2.36 | 2.31 | 2.28 |
Местоим. нареч. | 0.93 | 1.23 | 1.28 | 1.23 | 1.10 |
Числит. | 0.72 | 0.98 | 0.63 | 0.84 | 0.68 |
Числит-прилаг. | 0.25 | 0.40 | 0.09 | 0.20 | 0.15 |
Междомет. | 0.03 | 0.02 | 0.06 | 0.10 | 0.02 |
Часть комп. сложн. слова | 0.05 | 0.21 | 0.22 | 0.16 | 0.23 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 36.66 | 37.86 | 36.02 | 36.31 | 36.57 |
Глаг. | 13.46 | 13.07 | 13.72 | 13.06 | 13.86 |
Мест.-сущ. | 3.78 | 4.62 | 4.89 | 4.13 | 3.57 |
Предл. | 13.59 | 11.99 | 12.84 | 13.99 | 13.95 |
Союз | 6.56 | 7.08 | 7.36 | 6.49 | 6.85 |
Прилаг. | 13.68 | 12.87 | 13.05 | 13.27 | 12.97 |
Нареч. | 3.93 | 3.83 | 3.93 | 4.22 | 3.92 |
Местоим-прилаг. | 3.82 | 3.71 | 3.62 | 3.96 | 3.85 |
Частица | 2.26 | 2.22 | 2.21 | 2.36 | 2.10 |
Местоим. нареч. | 0.93 | 1.15 | 1.25 | 1.08 | 1.18 |
Числит. | 0.79 | 1.10 | 0.66 | 0.55 | 0.83 |
Числит-прилаг. | 0.34 | 0.12 | 0.19 | 0.35 | 0.19 |
Междомет. | 0.05 | 0.00 | 0.05 | 0.03 | 0.00 |
Часть комп. сложн. слова | 0.16 | 0.37 | 0.21 | 0.20 | 0.16 |
Последние комментарии
6 часов 39 минут назад
6 часов 41 минут назад
2 дней 13 часов назад
2 дней 17 часов назад
2 дней 19 часов назад
2 дней 20 часов назад