Лингвистический анализ: Как навести порядок в своем бизнесе. Как построить надежную систему из ненадежных элементов. Практикум (Михаил Рыбаков)
Общая статистика
Длина текста | 828862 знаков |
Длина диалогов | 7297 знаков |
Слов в произведении (СВП) | 112720 слов |
Приблизительно страниц | 461 стр. |
Средняя длина слова | 5.93 знаков |
Предложений в произведении (ПВП) | 11170 предл. |
Средняя длина предложения (СДП) | 71.26 знаков |
Доля диалогов в тексте | 0.88 % |
Доля авторского текста | 99.12 % |
СДП диалогов | 101.79 знаков |
СДП авторского текста | 79.07 знаков |
|
Максимальный фрагмент авторского текста - 176085 знаков (в страницах - примерно 98, начинается где-то с 407 страницы) |
Активный словарный запас
Использовано уникальных слов | 18580 | |
Активный словарный запас (АСЗ) | 17744 | |
Активный не словарный запас (АНСЗ) | 836 | |
Удельный АСЗ на 3000 слов текста | 1461.90 | 403729 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3638.67 | 350125 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 17304.19 | 29357 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1611) наблюдается примерно на 425 странице |
Минимальный УАСЗ-3000 (1236) наблюдается примерно на 123 странице |
|
Буквы и знаки препинания
Всего букв | 663799 букв |
Всего знаков препинания | 26046 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 9917 | 87.98 |
. | 11509 | 102.10 |
- | 1148 | 10.18 |
? | 547 | 4.85 |
! | 202 | 1.79 |
... | 0 | 0.00 |
!.. | 1 | 0.01 |
?.. | 8 | 0.07 |
!!! | 3 | 0.03 |
?! | 9 | 0.08 |
" | 0 | 0.00 |
() | 845 | 7.50 |
: | 1453 | 12.89 |
; | 404 | 3.58 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 51252 | 7.72 |
Б | 10009 | 1.51 |
В | 29053 | 4.38 |
Г | 9211 | 1.39 |
Д | 19655 | 2.96 |
Е-Ё | 58305 | 8.78 |
Ж | 9211 | 1.39 |
З | 10994 | 1.66 |
И-Й | 59884 | 9.02 |
К | 24402 | 3.68 |
Л | 24006 | 3.62 |
М | 21424 | 3.23 |
Н | 45897 | 6.91 |
О | 71546 | 10.78 |
П | 21388 | 3.22 |
Р | 32928 | 4.96 |
С | 34064 | 5.13 |
Т | 47057 | 7.09 |
У | 16339 | 2.46 |
Ф | 2069 | 0.31 |
Х | 5992 | 0.90 |
Ц | 3851 | 0.58 |
Ч | 9342 | 1.41 |
Ш | 3898 | 0.59 |
Щ | 1751 | 0.26 |
Ь-Ъ | 12511 | 1.88 |
Ы | 13212 | 1.99 |
Э | 2201 | 0.33 |
Ю | 4431 | 0.67 |
Я | 11501 | 1.73 |
|
Части речи
Определенных частей речи (ОЧР) | 111639 слов |
Не определенных частей речи (НОЧР) | 1081 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 37981 | 34.021 |
Глаг. | 7888 | 14.356 |
Мест.-сущ. | 7888 | 7.066 |
Предл. | 9826 | 10.491 |
Союз | 9943 | 9 |
Прилаг. | 9826 | 8.802 |
Нареч. | 7050 | 6.315 |
Местоим-прилаг. | 5948 | 5.328 |
Частица | 3238 | 2.900 |
Местоим. нареч. | 1180 | 1.057 |
Числит. | 497 | 0.445 |
Числит-прилаг. | 250 | 0.224 |
Междомет. | 74 | 0.066 |
Часть комп. сложн. слова | 25 | 0.022 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 108.66 | 44.59 | 17.87 | 48.44 | 45.21 | 26.28 | 20.74 | 16.42 | 6.34 | 4.15 | 0.85 | 0.37 | 0.17 | 0.12 |
Глаг. | 37.01 | 16.01 | 10.71 | 26.39 | 13.39 | 13.57 | 10.01 | 9.58 | 4.06 | 1.56 | 1.00 | 0.18 | 0.04 | 0.04 |
Мест.-сущ. | 11.33 | 23.34 | 3.48 | 5.19 | 5.68 | 4.92 | 8.89 | 2.38 | 4.31 | 0.79 | 0.22 | 0.10 | 0.04 | 0.00 |
Предл. | 54.59 | 1.59 | 14.93 | 0.55 | 1.00 | 14.17 | 0.98 | 14.53 | 0.13 | 0.04 | 1.16 | 1.15 | 0.07 | 0.03 |
Союз | 21.63 | 15.01 | 10.96 | 8.15 | 4.85 | 7.22 | 8.56 | 4.82 | 5.84 | 1.45 | 0.20 | 0.14 | 0.21 | 0.01 |
Прилаг. | 61.62 | 4.44 | 1.76 | 3.82 | 6.59 | 5.84 | 1.71 | 0.78 | 0.82 | 0.38 | 0.13 | 0.09 | 0.04 | 0.00 |
Нареч. | 6.95 | 19.93 | 4.54 | 6.02 | 6.13 | 6.82 | 6.65 | 1.87 | 2.96 | 0.68 | 0.47 | 0.07 | 0.05 | 0.02 |
Местоим-прилаг. | 29.19 | 5.16 | 3.22 | 2.53 | 2.08 | 5.75 | 2.10 | 1.18 | 1.47 | 0.32 | 0.12 | 0.09 | 0.04 | 0.02 |
Частица | 3.57 | 10.80 | 1.80 | 2.83 | 1.37 | 2.07 | 2.02 | 1.28 | 2.15 | 0.91 | 0.14 | 0.04 | 0.01 | 0.00 |
Местоим. нареч. | 0.77 | 2.25 | 1.08 | 0.71 | 2.40 | 0.64 | 1.28 | 0.33 | 0.82 | 0.24 | 0.04 | 0.00 | 0.00 | 0.00 |
Числит. | 3.07 | 0.21 | 0.15 | 0.13 | 0.23 | 0.47 | 0.05 | 0.06 | 0.00 | 0.01 | 0.05 | 0.00 | 0.00 | 0.00 |
Числит-прилаг. | 1.26 | 0.19 | 0.10 | 0.11 | 0.12 | 0.20 | 0.10 | 0.03 | 0.04 | 0.01 | 0.08 | 0.01 | 0.00 | 0.00 |
Междомет. | 0.38 | 0.04 | 0.04 | 0.04 | 0.01 | 0.01 | 0.05 | 0.01 | 0.07 | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.17 | 0.00 | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 21.69 | 30.12 | 30.75 | 32.35 | 34.38 |
Глаг. | 10.27 | 14.93 | 19.14 | 16.70 | 15.67 |
Мест.-сущ. | 8.15 | 10.59 | 7.79 | 7.76 | 6.43 |
Предл. | 13.71 | 8.12 | 10.52 | 10.26 | 10.84 |
Союз | 17.24 | 7.72 | 6.15 | 6.93 | 7.19 |
Прилаг. | 7.77 | 7.97 | 8.76 | 9.33 | 9.31 |
Нареч. | 11.17 | 7.78 | 6.67 | 5.93 | 5.57 |
Местоим-прилаг. | 3.68 | 6.15 | 5.16 | 5.97 | 5.93 |
Частица | 2.55 | 4.44 | 3.38 | 3.04 | 3.01 |
Местоим. нареч. | 3.11 | 1.21 | 0.86 | 0.80 | 0.87 |
Числит. | 0.30 | 0.37 | 0.44 | 0.69 | 0.49 |
Числит-прилаг. | 0.22 | 0.52 | 0.32 | 0.19 | 0.23 |
Междомет. | 0.12 | 0.05 | 0.06 | 0.02 | 0.06 |
Часть комп. сложн. слова | 0.01 | 0.02 | 0.01 | 0.04 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 33.14 | 33.32 | 34.40 | 33.06 | 33.73 |
Глаг. | 15.03 | 14.22 | 14.15 | 14.67 | 14.25 |
Мест.-сущ. | 6.55 | 6.35 | 6.63 | 6.74 | 6.69 |
Предл. | 11.22 | 11.71 | 11.05 | 11.82 | 11.71 |
Союз | 8.31 | 8.48 | 9.07 | 9.57 | 9.58 |
Прилаг. | 9.65 | 9.60 | 9.09 | 8.55 | 8.41 |
Нареч. | 5.75 | 5.66 | 5.04 | 5.08 | 5.52 |
Местоим-прилаг. | 6.23 | 6.12 | 6.04 | 6.13 | 5.54 |
Частица | 2.75 | 2.85 | 2.79 | 2.64 | 2.95 |
Местоим. нареч. | 0.76 | 0.88 | 0.93 | 0.87 | 0.85 |
Числит. | 0.33 | 0.46 | 0.51 | 0.59 | 0.45 |
Числит-прилаг. | 0.18 | 0.04 | 0.20 | 0.15 | 0.23 |
Междомет. | 0.08 | 0.19 | 0.07 | 0.13 | 0.04 |
Часть комп. сложн. слова | 0.03 | 0.10 | 0.03 | 0.00 | 0.04 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 32.40 | 34.11 | 34.12 | 30.80 | 32.82 |
Глаг. | 13.60 | 13.89 | 13.06 | 12.93 | 15.70 |
Мест.-сущ. | 7.60 | 6.35 | 6.91 | 7.08 | 6.68 |
Предл. | 12.20 | 10.81 | 12.43 | 12.64 | 10.94 |
Союз | 9.73 | 10.08 | 9.82 | 10.42 | 9.56 |
Прилаг. | 9.31 | 9.30 | 8.22 | 9.34 | 8.35 |
Нареч. | 5.05 | 5.62 | 4.87 | 4.98 | 5.47 |
Местоим-прилаг. | 5.52 | 5.92 | 5.56 | 5.78 | 6.26 |
Частица | 3.03 | 2.24 | 3.11 | 4.21 | 2.96 |
Местоим. нареч. | 0.78 | 0.89 | 0.72 | 0.87 | 0.63 |
Числит. | 0.40 | 0.51 | 0.85 | 0.58 | 0.38 |
Числит-прилаг. | 0.36 | 0.16 | 0.19 | 0.29 | 0.25 |
Междомет. | 0.00 | 0.08 | 0.13 | 0.07 | 0.00 |
Часть комп. сложн. слова | 0.02 | 0.03 | 0.03 | 0.00 | 0.00 |
Последние комментарии
5 часов 19 минут назад
6 часов 25 минут назад
7 часов 23 минут назад
7 часов 38 минут назад
16 часов 48 минут назад
16 часов 49 минут назад