Лингвистический анализ: Собрание сочинений. Том 4 (Артур Конан Дойль)
Общая статистика
Длина текста | 1104974 знаков |
Длина диалогов | 460661 знаков |
Слов в произведении (СВП) | 169960 слов |
Приблизительно страниц | 614 стр. |
Средняя длина слова | 5.20 знаков |
Предложений в произведении (ПВП) | 11266 предл. |
Средняя длина предложения (СДП) | 95.23 знаков |
Доля диалогов в тексте | 41.69 % |
Доля авторского текста | 58.31 % |
СДП диалогов | 79.83 знаков |
СДП авторского текста | 124.88 знаков |
|
Максимальный фрагмент авторского текста - 31109 знаков (в страницах - примерно 17, начинается где-то с 574 страницы) |
Активный словарный запас
Использовано уникальных слов | 32106 | |
Активный словарный запас (АСЗ) | 31282 | |
Активный не словарный запас (АНСЗ) | 824 | |
Удельный АСЗ на 3000 слов текста | 1526.54 | 36018 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4020.94 | 38403 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 22510.58 | 31462 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1771) наблюдается примерно на 610 странице |
Минимальный УАСЗ-3000 (1289) наблюдается примерно на 563 странице |
|
Буквы и знаки препинания
Всего букв | 883130 букв |
Всего знаков препинания | 36702 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 21108 | 124.19 |
. | 10826 | 63.70 |
- | 1638 | 9.64 |
? | 1233 | 7.25 |
! | 1291 | 7.60 |
... | 0 | 0.00 |
!.. | 6 | 0.04 |
?.. | 3 | 0.02 |
!!! | 0 | 0.00 |
?! | 14 | 0.08 |
" | 0 | 0.00 |
() | 84 | 0.49 |
: | 338 | 1.99 |
; | 161 | 0.95 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 67945 | 7.69 |
Б | 15685 | 1.78 |
В | 38267 | 4.33 |
Г | 16154 | 1.83 |
Д | 27821 | 3.15 |
Е-Ё | 75479 | 8.55 |
Ж | 16154 | 1.83 |
З | 15336 | 1.74 |
И-Й | 67823 | 7.68 |
К | 30644 | 3.47 |
Л | 42876 | 4.86 |
М | 30092 | 3.41 |
Н | 56934 | 6.45 |
О | 99358 | 11.25 |
П | 24131 | 2.73 |
Р | 39269 | 4.45 |
С | 48958 | 5.54 |
Т | 54826 | 6.21 |
У | 25131 | 2.85 |
Ф | 1558 | 0.18 |
Х | 7353 | 0.83 |
Ц | 2813 | 0.32 |
Ч | 13004 | 1.47 |
Ш | 7400 | 0.84 |
Щ | 2890 | 0.33 |
Ь-Ъ | 17261 | 1.95 |
Ы | 17215 | 1.95 |
Э | 4453 | 0.50 |
Ю | 4856 | 0.55 |
Я | 18463 | 2.09 |
|
Части речи
Определенных частей речи (ОЧР) | 169814 слов |
Не определенных частей речи (НОЧР) | 146 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 42263 | 24.888 |
Глаг. | 18859 | 18.620 |
Мест.-сущ. | 18859 | 11.106 |
Предл. | 12420 | 10.109 |
Союз | 15802 | 9 |
Прилаг. | 12420 | 7.314 |
Нареч. | 10289 | 6.059 |
Местоим-прилаг. | 8995 | 5.297 |
Частица | 7797 | 4.591 |
Местоим. нареч. | 2901 | 1.708 |
Числит. | 1219 | 0.718 |
Числит-прилаг. | 265 | 0.156 |
Междомет. | 208 | 0.122 |
Часть комп. сложн. слова | 10 | 0.006 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 45.62 | 52.05 | 21.46 | 31.13 | 43.60 | 12.53 | 14.76 | 12.32 | 9.15 | 4.08 | 1.32 | 0.33 | 0.50 | 0.02 |
Глаг. | 36.85 | 20.81 | 24.99 | 37.97 | 18.25 | 12.41 | 11.18 | 10.31 | 8.22 | 3.60 | 1.18 | 0.24 | 0.20 | 0.01 |
Мест.-сущ. | 15.07 | 36.38 | 6.87 | 8.82 | 7.81 | 7.02 | 11.62 | 4.22 | 9.95 | 2.63 | 0.54 | 0.07 | 0.05 | 0.00 |
Предл. | 47.70 | 1.88 | 19.96 | 0.55 | 1.11 | 12.63 | 0.76 | 13.74 | 0.16 | 0.14 | 1.84 | 0.56 | 0.04 | 0.03 |
Союз | 14.38 | 18.73 | 18.47 | 7.87 | 4.14 | 5.92 | 7.89 | 4.98 | 7.00 | 2.98 | 0.54 | 0.11 | 0.03 | 0.00 |
Прилаг. | 49.91 | 4.62 | 1.96 | 2.44 | 5.22 | 5.84 | 0.99 | 0.88 | 0.68 | 0.41 | 0.12 | 0.04 | 0.04 | 0.01 |
Нареч. | 3.89 | 23.37 | 5.04 | 5.08 | 5.42 | 5.46 | 5.65 | 1.65 | 3.55 | 0.84 | 0.52 | 0.05 | 0.06 | 0.00 |
Местоим-прилаг. | 24.83 | 5.27 | 4.24 | 2.13 | 1.89 | 7.23 | 1.99 | 1.88 | 2.26 | 0.82 | 0.34 | 0.05 | 0.03 | 0.00 |
Частица | 4.08 | 19.12 | 5.16 | 3.37 | 2.55 | 2.11 | 3.53 | 2.16 | 2.43 | 1.10 | 0.25 | 0.03 | 0.04 | 0.00 |
Местоим. нареч. | 1.07 | 3.25 | 2.50 | 1.32 | 2.58 | 1.15 | 1.88 | 0.55 | 2.31 | 0.36 | 0.08 | 0.02 | 0.01 | 0.00 |
Числит. | 4.26 | 0.48 | 0.23 | 0.30 | 0.24 | 0.68 | 0.22 | 0.14 | 0.10 | 0.05 | 0.42 | 0.07 | 0.00 | 0.00 |
Числит-прилаг. | 0.97 | 0.14 | 0.05 | 0.06 | 0.11 | 0.08 | 0.04 | 0.05 | 0.04 | 0.01 | 0.02 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.22 | 0.11 | 0.12 | 0.05 | 0.14 | 0.04 | 0.06 | 0.11 | 0.06 | 0.08 | 0.01 | 0.00 | 0.22 | 0.00 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.03 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 14.81 | 18.97 | 21.60 | 22.79 | 24.39 |
Глаг. | 9.95 | 21.86 | 22.81 | 23.46 | 20.88 |
Мест.-сущ. | 18.69 | 14.83 | 13.17 | 12.64 | 11.25 |
Предл. | 9.78 | 6.77 | 8.79 | 9.34 | 10.32 |
Союз | 19.43 | 6.53 | 6.40 | 6.99 | 8.00 |
Прилаг. | 3.53 | 5.34 | 6.19 | 6.54 | 6.87 |
Нареч. | 7.50 | 7.90 | 6.99 | 6.14 | 6.45 |
Местоим-прилаг. | 4.17 | 5.90 | 5.01 | 5.12 | 5.08 |
Частица | 7.30 | 8.21 | 6.25 | 4.30 | 4.14 |
Местоим. нареч. | 2.90 | 2.46 | 1.70 | 1.92 | 1.56 |
Числит. | 0.69 | 0.79 | 0.78 | 0.63 | 0.89 |
Числит-прилаг. | 0.19 | 0.17 | 0.20 | 0.11 | 0.12 |
Междомет. | 1.05 | 0.25 | 0.11 | 0.03 | 0.04 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 25.23 | 24.85 | 24.53 | 25.52 | 24.81 |
Глаг. | 19.94 | 18.57 | 19.67 | 19.12 | 17.96 |
Мест.-сущ. | 10.26 | 10.62 | 9.59 | 9.97 | 9.71 |
Предл. | 10.35 | 10.83 | 10.93 | 11.44 | 11.19 |
Союз | 9.61 | 10.02 | 9.86 | 9.37 | 10.59 |
Прилаг. | 7.53 | 7.67 | 7.63 | 7.36 | 8.03 |
Нареч. | 5.56 | 6.09 | 5.75 | 6.09 | 5.68 |
Местоим-прилаг. | 5.07 | 4.87 | 5.68 | 5.00 | 5.84 |
Частица | 4.15 | 4.05 | 4.13 | 3.81 | 3.84 |
Местоим. нареч. | 1.31 | 1.54 | 1.40 | 1.48 | 1.50 |
Числит. | 0.85 | 0.74 | 0.68 | 0.66 | 0.62 |
Числит-прилаг. | 0.12 | 0.11 | 0.09 | 0.12 | 0.19 |
Междомет. | 0.02 | 0.04 | 0.05 | 0.04 | 0.06 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.01 | 0.01 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 25.18 | 24.43 | 25.50 | 24.15 | 23.59 |
Глаг. | 17.30 | 18.55 | 18.75 | 17.92 | 17.57 |
Мест.-сущ. | 10.82 | 10.14 | 9.22 | 10.25 | 9.88 |
Предл. | 11.24 | 11.06 | 11.19 | 11.44 | 11.45 |
Союз | 9.80 | 10.07 | 9.57 | 9.86 | 11.06 |
Прилаг. | 7.48 | 7.76 | 7.88 | 8.63 | 8.27 |
Нареч. | 5.57 | 5.47 | 5.53 | 5.85 | 5.48 |
Местоим-прилаг. | 5.72 | 5.41 | 5.57 | 5.55 | 5.67 |
Частица | 4.13 | 4.55 | 4.13 | 4.03 | 4.23 |
Местоим. нареч. | 1.81 | 1.48 | 1.58 | 1.60 | 1.74 |
Числит. | 0.80 | 0.86 | 0.87 | 0.49 | 0.86 |
Числит-прилаг. | 0.12 | 0.20 | 0.16 | 0.12 | 0.11 |
Междомет. | 0.03 | 0.02 | 0.05 | 0.10 | 0.09 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 |
Последние комментарии
5 часов 15 минут назад
5 часов 50 минут назад
6 часов 43 минут назад
6 часов 48 минут назад
6 часов 59 минут назад
7 часов 12 минут назад