Лингвистический анализ: В поисках утраченных предков (сборник) (Дмитрий Каралис)
Общая статистика
Длина текста | 1100710 знаков |
Длина диалогов | 235124 знаков |
Слов в произведении (СВП) | 165878 слов |
Приблизительно страниц | 612 стр. |
Средняя длина слова | 5.29 знаков |
Предложений в произведении (ПВП) | 11932 предл. |
Средняя длина предложения (СДП) | 89.44 знаков |
Доля диалогов в тексте | 21.36 % |
Доля авторского текста | 78.64 % |
СДП диалогов | 71.35 знаков |
СДП авторского текста | 105.58 знаков |
|
Максимальный фрагмент авторского текста - 34255 знаков (в страницах - примерно 19, начинается где-то с 622 страницы) |
Активный словарный запас
Использовано уникальных слов | 38434 | |
Активный словарный запас (АСЗ) | 37388 | |
Активный не словарный запас (АНСЗ) | 1046 | |
Удельный АСЗ на 3000 слов текста | 1663.40 | 247543 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4566.43 | 227095 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 27101.90 | 35050 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1908) наблюдается примерно на 442 странице |
Минимальный УАСЗ-3000 (1470) наблюдается примерно на 251 странице |
|
Буквы и знаки препинания
Всего букв | 877242 букв |
Всего знаков препинания | 36522 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 18787 | 113.26 |
. | 10998 | 66.30 |
- | 1653 | 9.97 |
? | 1544 | 9.31 |
! | 1853 | 11.17 |
... | 0 | 0.00 |
!.. | 96 | 0.58 |
?.. | 96 | 0.58 |
!!! | 0 | 0.00 |
?! | 6 | 0.04 |
" | 0 | 0.00 |
() | 162 | 0.98 |
: | 1203 | 7.25 |
; | 124 | 0.75 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 75716 | 8.63 |
Б | 14089 | 1.61 |
В | 38585 | 4.40 |
Г | 14912 | 1.70 |
Д | 29108 | 3.32 |
Е-Ё | 70910 | 8.08 |
Ж | 14912 | 1.70 |
З | 14727 | 1.68 |
И-Й | 73308 | 8.36 |
К | 34767 | 3.96 |
Л | 42573 | 4.85 |
М | 29329 | 3.34 |
Н | 53544 | 6.10 |
О | 92418 | 10.54 |
П | 25532 | 2.91 |
Р | 40502 | 4.62 |
С | 46717 | 5.33 |
Т | 51245 | 5.84 |
У | 25503 | 2.91 |
Ф | 2322 | 0.26 |
Х | 7792 | 0.89 |
Ц | 4228 | 0.48 |
Ч | 12211 | 1.39 |
Ш | 7783 | 0.89 |
Щ | 2786 | 0.32 |
Ь-Ъ | 15813 | 1.80 |
Ы | 15885 | 1.81 |
Э | 1633 | 0.19 |
Ю | 5343 | 0.61 |
Я | 19330 | 2.20 |
|
Части речи
Определенных частей речи (ОЧР) | 165644 слов |
Не определенных частей речи (НОЧР) | 234 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 50364 | 30.405 |
Глаг. | 13603 | 18.912 |
Мест.-сущ. | 13603 | 8.212 |
Предл. | 12835 | 11.635 |
Союз | 14385 | 9 |
Прилаг. | 12835 | 7.749 |
Нареч. | 7994 | 4.826 |
Местоим-прилаг. | 5707 | 3.445 |
Частица | 5944 | 3.588 |
Местоим. нареч. | 2115 | 1.277 |
Числит. | 1366 | 0.825 |
Числит-прилаг. | 520 | 0.314 |
Междомет. | 176 | 0.106 |
Часть комп. сложн. слова | 35 | 0.021 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 70.72 | 62.44 | 19.91 | 45.82 | 46.26 | 18.71 | 14.12 | 9.08 | 9.58 | 4.06 | 2.03 | 0.73 | 0.52 | 0.06 |
Глаг. | 47.90 | 21.73 | 18.78 | 42.11 | 19.69 | 12.99 | 9.46 | 5.93 | 6.31 | 2.35 | 1.26 | 0.40 | 0.19 | 0.01 |
Мест.-сущ. | 11.37 | 29.18 | 4.64 | 8.52 | 4.85 | 4.52 | 7.73 | 2.57 | 6.47 | 1.53 | 0.57 | 0.14 | 0.03 | 0.00 |
Предл. | 66.77 | 2.04 | 13.02 | 0.49 | 0.79 | 19.08 | 1.01 | 9.57 | 0.07 | 0.01 | 2.25 | 1.11 | 0.04 | 0.10 |
Союз | 15.85 | 24.69 | 12.67 | 7.06 | 3.08 | 5.16 | 6.74 | 3.19 | 5.22 | 2.48 | 0.53 | 0.14 | 0.01 | 0.01 |
Прилаг. | 56.33 | 3.76 | 1.45 | 2.29 | 3.64 | 7.35 | 0.93 | 0.53 | 0.69 | 0.27 | 0.16 | 0.05 | 0.04 | 0.01 |
Нареч. | 4.87 | 20.20 | 3.77 | 4.50 | 3.95 | 2.61 | 3.25 | 1.10 | 2.95 | 0.50 | 0.49 | 0.05 | 0.03 | 0.00 |
Местоим-прилаг. | 17.32 | 3.98 | 2.55 | 1.52 | 1.03 | 4.16 | 1.42 | 0.56 | 1.12 | 0.51 | 0.18 | 0.10 | 0.01 | 0.01 |
Частица | 4.00 | 17.33 | 2.85 | 2.55 | 1.62 | 1.43 | 2.34 | 1.27 | 1.52 | 0.72 | 0.19 | 0.02 | 0.03 | 0.00 |
Местоим. нареч. | 1.25 | 3.02 | 2.03 | 1.07 | 1.39 | 0.46 | 1.07 | 0.45 | 1.68 | 0.27 | 0.07 | 0.02 | 0.00 | 0.00 |
Числит. | 5.22 | 0.29 | 0.21 | 0.24 | 0.29 | 0.75 | 0.11 | 0.16 | 0.15 | 0.02 | 0.46 | 0.34 | 0.00 | 0.00 |
Числит-прилаг. | 2.04 | 0.27 | 0.13 | 0.13 | 0.15 | 0.18 | 0.04 | 0.01 | 0.05 | 0.03 | 0.05 | 0.04 | 0.01 | 0.00 |
Междомет. | 0.28 | 0.19 | 0.11 | 0.05 | 0.11 | 0.01 | 0.04 | 0.04 | 0.05 | 0.01 | 0.00 | 0.00 | 0.16 | 0.00 |
Часть комп. сложн. слова | 0.12 | 0.00 | 0.00 | 0.00 | 0.00 | 0.08 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 21.18 | 20.98 | 25.98 | 29.44 | 30.10 |
Глаг. | 11.71 | 25.62 | 22.34 | 21.19 | 20.01 |
Мест.-сущ. | 16.89 | 12.00 | 10.62 | 8.72 | 7.21 |
Предл. | 9.66 | 8.50 | 11.59 | 11.36 | 12.32 |
Союз | 14.96 | 5.88 | 6.98 | 7.14 | 8.21 |
Прилаг. | 4.25 | 5.65 | 5.69 | 7.38 | 8.06 |
Нареч. | 7.28 | 7.37 | 5.53 | 4.95 | 4.80 |
Местоим-прилаг. | 3.25 | 4.01 | 3.76 | 3.66 | 3.59 |
Частица | 6.29 | 6.46 | 4.68 | 3.53 | 3.51 |
Местоим. нареч. | 2.62 | 2.13 | 1.44 | 1.25 | 0.96 |
Числит. | 0.90 | 0.91 | 0.93 | 0.88 | 0.89 |
Числит-прилаг. | 0.42 | 0.40 | 0.33 | 0.43 | 0.27 |
Междомет. | 0.59 | 0.10 | 0.10 | 0.07 | 0.04 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.02 | 0.00 | 0.02 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 30.87 | 31.56 | 31.00 | 30.03 | 30.83 |
Глаг. | 20.25 | 18.57 | 17.98 | 19.49 | 17.90 |
Мест.-сущ. | 7.07 | 6.84 | 6.82 | 6.71 | 7.06 |
Предл. | 12.33 | 12.20 | 12.57 | 13.55 | 13.40 |
Союз | 8.74 | 9.09 | 9.60 | 9.19 | 8.35 |
Прилаг. | 8.10 | 8.45 | 8.69 | 8.19 | 8.57 |
Нареч. | 4.24 | 4.53 | 4.43 | 4.02 | 4.56 |
Местоим-прилаг. | 3.42 | 3.41 | 3.44 | 3.18 | 3.78 |
Частица | 3.11 | 2.85 | 3.13 | 3.43 | 3.07 |
Местоим. нареч. | 0.81 | 1.09 | 1.06 | 1.02 | 1.20 |
Числит. | 0.77 | 0.88 | 0.89 | 0.83 | 0.97 |
Числит-прилаг. | 0.20 | 0.44 | 0.31 | 0.31 | 0.22 |
Междомет. | 0.07 | 0.07 | 0.08 | 0.03 | 0.05 |
Часть комп. сложн. слова | 0.01 | 0.01 | 0.00 | 0.02 | 0.05 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 31.46 | 29.71 | 32.63 | 29.48 | 30.57 |
Глаг. | 18.34 | 18.73 | 18.36 | 18.57 | 18.28 |
Мест.-сущ. | 7.13 | 7.05 | 7.46 | 7.07 | 6.45 |
Предл. | 12.96 | 13.59 | 12.74 | 12.92 | 13.13 |
Союз | 9.27 | 9.88 | 8.42 | 10.09 | 9.14 |
Прилаг. | 8.13 | 8.77 | 7.89 | 8.46 | 9.27 |
Нареч. | 3.85 | 3.22 | 3.95 | 4.00 | 4.23 |
Местоим-прилаг. | 3.31 | 3.75 | 3.33 | 3.38 | 3.67 |
Частица | 3.11 | 3.46 | 2.89 | 3.52 | 3.04 |
Местоим. нареч. | 0.98 | 0.73 | 1.23 | 1.29 | 0.92 |
Числит. | 0.89 | 0.73 | 0.88 | 0.81 | 0.87 |
Числит-прилаг. | 0.48 | 0.28 | 0.15 | 0.26 | 0.29 |
Междомет. | 0.09 | 0.10 | 0.04 | 0.07 | 0.05 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.02 | 0.07 | 0.08 |
Последние комментарии
3 часов 25 минут назад
5 часов 56 минут назад
6 часов 4 минут назад
1 день 17 часов назад
1 день 21 часов назад
1 день 23 часов назад