Лингвистический анализ: Статьи из "Арабесок" (Николай Гоголь)
Общая статистика
Длина текста | 895070 знаков |
Длина диалогов | 173 знаков |
Слов в произведении (СВП) | 131107 слов |
Приблизительно страниц | 498 стр. |
Средняя длина слова | 5.60 знаков |
Предложений в произведении (ПВП) | 4475 предл. |
Средняя длина предложения (СДП) | 197.10 знаков |
Доля диалогов в тексте | 0.02 % |
Доля авторского текста | 99.98 % |
СДП диалогов | 173.00 знаков |
СДП авторского текста | 183.16 знаков |
|
Максимальный фрагмент авторского текста - 710762 знаков (в страницах - примерно 395, начинается где-то с 109 страницы) |
Активный словарный запас
Использовано уникальных слов | 15999 | |
Активный словарный запас (АСЗ) | 14992 | |
Активный не словарный запас (АНСЗ) | 1007 | |
Удельный АСЗ на 3000 слов текста | 998.61 | 203587 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 2693.04 | 360451 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 14152.47 | 68265 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1704) наблюдается примерно на 129 странице |
Минимальный УАСЗ-3000 (329) наблюдается примерно на 178 странице |
|
Буквы и знаки препинания
Всего букв | 730201 букв |
Всего знаков препинания | 26348 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 16114 | 122.91 |
. | 4897 | 37.35 |
- | 625 | 4.77 |
? | 406 | 3.10 |
! | 250 | 1.91 |
... | 0 | 0.00 |
!.. | 2 | 0.02 |
?.. | 0 | 0.00 |
!!! | 0 | 0.00 |
?! | 0 | 0.00 |
" | 2 | 0.02 |
() | 124 | 0.95 |
: | 789 | 6.02 |
; | 3139 | 23.94 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 51171 | 7.01 |
Б | 12038 | 1.65 |
В | 35814 | 4.90 |
Г | 14020 | 1.92 |
Д | 20946 | 2.87 |
Е-Ё | 68257 | 9.35 |
Ж | 14020 | 1.92 |
З | 12311 | 1.69 |
И-Й | 65861 | 9.02 |
К | 24189 | 3.31 |
Л | 29213 | 4.00 |
М | 23407 | 3.21 |
Н | 49928 | 6.84 |
О | 78787 | 10.79 |
П | 17155 | 2.35 |
Р | 33952 | 4.65 |
С | 43301 | 5.93 |
Т | 44207 | 6.05 |
У | 17382 | 2.38 |
Ф | 939 | 0.13 |
Х | 7558 | 1.04 |
Ц | 2418 | 0.33 |
Ч | 9171 | 1.26 |
Ш | 5897 | 0.81 |
Щ | 3192 | 0.44 |
Ь-Ъ | 11592 | 1.59 |
Ы | 16744 | 2.29 |
Э | 2249 | 0.31 |
Ю | 6434 | 0.88 |
Я | 14248 | 1.95 |
|
Части речи
Определенных частей речи (ОЧР) | 128903 слов |
Не определенных частей речи (НОЧР) | 2204 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 35947 | 27.887 |
Глаг. | 9060 | 14.438 |
Мест.-сущ. | 9060 | 7.029 |
Предл. | 15684 | 9.716 |
Союз | 11537 | 9 |
Прилаг. | 15684 | 12.167 |
Нареч. | 7094 | 5.503 |
Местоим-прилаг. | 9854 | 7.645 |
Частица | 5499 | 4.266 |
Местоим. нареч. | 2412 | 1.871 |
Числит. | 400 | 0.310 |
Числит-прилаг. | 213 | 0.165 |
Междомет. | 41 | 0.032 |
Часть комп. сложн. слова | 27 | 0.021 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 56.46 | 43.31 | 18.39 | 32.40 | 46.29 | 27.03 | 13.47 | 23.94 | 9.70 | 6.72 | 0.63 | 0.32 | 0.12 | 0.09 |
Глаг. | 30.67 | 11.72 | 12.66 | 30.22 | 11.13 | 16.38 | 9.74 | 12.54 | 6.38 | 2.02 | 0.54 | 0.30 | 0.02 | 0.04 |
Мест.-сущ. | 14.57 | 14.87 | 2.66 | 5.76 | 5.42 | 9.18 | 6.74 | 3.72 | 5.58 | 1.44 | 0.22 | 0.10 | 0.02 | 0.00 |
Предл. | 37.75 | 2.05 | 18.42 | 0.67 | 0.67 | 17.03 | 0.40 | 18.35 | 0.31 | 0.05 | 0.85 | 0.57 | 0.00 | 0.03 |
Союз | 19.68 | 16.39 | 5.84 | 7.87 | 2.94 | 13.55 | 7.98 | 5.48 | 7.06 | 2.23 | 0.26 | 0.08 | 0.12 | 0.02 |
Прилаг. | 72.30 | 7.18 | 3.17 | 5.81 | 11.70 | 12.12 | 2.25 | 3.08 | 1.61 | 2.23 | 0.12 | 0.06 | 0.01 | 0.02 |
Нареч. | 3.87 | 18.41 | 2.68 | 5.73 | 4.49 | 7.07 | 5.52 | 2.40 | 3.54 | 1.09 | 0.12 | 0.09 | 0.01 | 0.00 |
Местоим-прилаг. | 32.36 | 9.51 | 3.51 | 3.76 | 2.58 | 12.53 | 3.32 | 3.37 | 3.47 | 1.73 | 0.19 | 0.09 | 0.01 | 0.01 |
Частица | 5.90 | 18.07 | 2.16 | 3.17 | 1.88 | 3.10 | 2.70 | 2.67 | 2.08 | 0.84 | 0.08 | 0.02 | 0.01 | 0.00 |
Местоим. нареч. | 2.53 | 2.50 | 0.59 | 1.56 | 2.24 | 2.70 | 2.80 | 0.63 | 2.79 | 0.35 | 0.02 | 0.01 | 0.00 | 0.00 |
Числит. | 1.64 | 0.22 | 0.05 | 0.04 | 0.10 | 0.78 | 0.07 | 0.09 | 0.03 | 0.00 | 0.09 | 0.00 | 0.00 | 0.00 |
Числит-прилаг. | 0.95 | 0.12 | 0.08 | 0.15 | 0.03 | 0.11 | 0.00 | 0.15 | 0.05 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 |
Междомет. | 0.07 | 0.02 | 0.09 | 0.01 | 0.02 | 0.05 | 0.04 | 0.02 | 0.01 | 0.01 | 0.00 | 0.00 | 0.01 | 0.00 |
Часть комп. сложн. слова | 0.09 | 0.01 | 0.00 | 0.00 | 0.00 | 0.07 | 0.00 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 15.68 | 24.11 | 26.55 | 27.17 | 25.46 |
Глаг. | 9.78 | 15.74 | 15.61 | 15.04 | 16.61 |
Мест.-сущ. | 11.82 | 8.83 | 9.16 | 9.41 | 8.29 |
Предл. | 13.60 | 8.52 | 8.22 | 9.13 | 8.75 |
Союз | 17.72 | 6.28 | 7.68 | 7.76 | 7.53 |
Прилаг. | 7.51 | 12.00 | 10.37 | 10.38 | 11.71 |
Нареч. | 5.71 | 7.19 | 6.12 | 6.20 | 6.45 |
Местоим-прилаг. | 7.82 | 8.38 | 7.06 | 6.73 | 7.35 |
Частица | 5.71 | 6.20 | 6.52 | 6.18 | 5.08 |
Местоим. нареч. | 3.84 | 2.00 | 1.98 | 1.50 | 2.04 |
Числит. | 0.33 | 0.29 | 0.27 | 0.20 | 0.31 |
Числит-прилаг. | 0.21 | 0.36 | 0.27 | 0.23 | 0.36 |
Междомет. | 0.26 | 0.05 | 0.07 | 0.05 | 0.08 |
Часть комп. сложн. слова | 0.02 | 0.05 | 0.10 | 0.03 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 27.24 | 27.03 | 28.12 | 28.56 | 27.79 |
Глаг. | 15.49 | 15.48 | 15.27 | 13.77 | 14.38 |
Мест.-сущ. | 7.11 | 6.32 | 6.83 | 6.11 | 6.69 |
Предл. | 9.52 | 9.24 | 8.55 | 10.06 | 9.59 |
Союз | 7.60 | 8.16 | 8.36 | 9.62 | 8.71 |
Прилаг. | 12.22 | 11.62 | 13.06 | 11.09 | 12.96 |
Нареч. | 6.72 | 5.98 | 5.83 | 6.44 | 5.84 |
Местоим-прилаг. | 6.59 | 8.32 | 7.61 | 8.13 | 7.49 |
Частица | 5.06 | 5.12 | 4.11 | 3.76 | 3.97 |
Местоим. нареч. | 1.84 | 2.07 | 1.51 | 1.74 | 1.87 |
Числит. | 0.31 | 0.34 | 0.48 | 0.30 | 0.51 |
Числит-прилаг. | 0.21 | 0.29 | 0.16 | 0.17 | 0.14 |
Междомет. | 0.08 | 0.00 | 0.08 | 0.14 | 0.03 |
Часть комп. сложн. слова | 0.03 | 0.03 | 0.03 | 0.11 | 0.03 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 27.84 | 28.52 | 28.23 | 28.45 | 26.73 |
Глаг. | 14.37 | 14.44 | 14.08 | 14.40 | 15.70 |
Мест.-сущ. | 6.91 | 5.59 | 8.06 | 6.24 | 7.51 |
Предл. | 9.46 | 10.94 | 9.31 | 10.05 | 9.75 |
Союз | 9.69 | 9.24 | 8.78 | 9.27 | 8.63 |
Прилаг. | 12.00 | 12.65 | 12.62 | 12.26 | 12.08 |
Нареч. | 5.94 | 5.26 | 5.12 | 5.85 | 5.82 |
Местоим-прилаг. | 7.49 | 7.32 | 7.50 | 7.05 | 8.05 |
Частица | 3.92 | 3.56 | 3.44 | 4.19 | 3.52 |
Местоим. нареч. | 1.84 | 1.82 | 2.25 | 1.72 | 1.83 |
Числит. | 0.32 | 0.33 | 0.44 | 0.42 | 0.24 |
Числит-прилаг. | 0.12 | 0.27 | 0.12 | 0.10 | 0.14 |
Междомет. | 0.03 | 0.06 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.06 | 0.00 | 0.06 | 0.00 | 0.00 |
Последние комментарии
4 часов 31 минут назад
4 часов 49 минут назад
4 часов 58 минут назад
4 часов 59 минут назад
5 часов 2 минут назад
5 часов 19 минут назад