Лингвистический анализ: Архив Шерлока Холмса. Открытие Рафлза Хоу (сборник) (Артур Конан Дойль)
Общая статистика
Длина текста | 697005 знаков |
Длина диалогов | 401229 знаков |
Слов в произведении (СВП) | 108409 слов |
Приблизительно страниц | 388 стр. |
Средняя длина слова | 5.10 знаков |
Предложений в произведении (ПВП) | 8730 предл. |
Средняя длина предложения (СДП) | 76.99 знаков |
Доля диалогов в тексте | 57.56 % |
Доля авторского текста | 42.44 % |
СДП диалогов | 77.35 знаков |
СДП авторского текста | 99.86 знаков |
|
Максимальный фрагмент авторского текста - 6379 знаков (в страницах - примерно 4, начинается где-то с 289 страницы) |
Активный словарный запас
Использовано уникальных слов | 21151 | |
Активный словарный запас (АСЗ) | 20489 | |
Активный не словарный запас (АНСЗ) | 662 | |
Удельный АСЗ на 3000 слов текста | 1461.94 | 470298 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3756.72 | 409483 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 20069.20 | 15874 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1777) наблюдается примерно на 379 странице |
Минимальный УАСЗ-3000 (1314) наблюдается примерно на 146 странице |
|
Буквы и знаки препинания
Всего букв | 552355 букв |
Всего знаков препинания | 24373 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 13223 | 121.97 |
. | 8127 | 74.97 |
- | 1051 | 9.69 |
? | 1054 | 9.72 |
! | 520 | 4.80 |
... | 0 | 0.00 |
!.. | 6 | 0.06 |
?.. | 4 | 0.04 |
!!! | 0 | 0.00 |
?! | 4 | 0.04 |
" | 0 | 0.00 |
() | 130 | 1.20 |
: | 157 | 1.45 |
; | 97 | 0.89 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 41945 | 7.59 |
Б | 9296 | 1.68 |
В | 23373 | 4.23 |
Г | 9718 | 1.76 |
Д | 16289 | 2.95 |
Е-Ё | 47858 | 8.66 |
Ж | 9718 | 1.76 |
З | 9137 | 1.65 |
И-Й | 41326 | 7.48 |
К | 18653 | 3.38 |
Л | 25940 | 4.70 |
М | 20333 | 3.68 |
Н | 36955 | 6.69 |
О | 64614 | 11.70 |
П | 14015 | 2.54 |
Р | 24442 | 4.43 |
С | 30942 | 5.60 |
Т | 35477 | 6.42 |
У | 14628 | 2.65 |
Ф | 985 | 0.18 |
Х | 4981 | 0.90 |
Ц | 1767 | 0.32 |
Ч | 8512 | 1.54 |
Ш | 4453 | 0.81 |
Щ | 1777 | 0.32 |
Ь-Ъ | 10864 | 1.97 |
Ы | 10349 | 1.87 |
Э | 2866 | 0.52 |
Ю | 3132 | 0.57 |
Я | 11898 | 2.15 |
|
Части речи
Определенных частей речи (ОЧР) | 108190 слов |
Не определенных частей речи (НОЧР) | 219 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 25914 | 23.952 |
Глаг. | 14007 | 18.150 |
Мест.-сущ. | 14007 | 12.947 |
Предл. | 7554 | 10.159 |
Союз | 9566 | 9 |
Прилаг. | 7554 | 6.982 |
Нареч. | 6489 | 5.998 |
Местоим-прилаг. | 6108 | 5.646 |
Частица | 5274 | 4.875 |
Местоим. нареч. | 1735 | 1.604 |
Числит. | 632 | 0.584 |
Числит-прилаг. | 193 | 0.178 |
Междомет. | 78 | 0.072 |
Часть комп. сложн. слова | 12 | 0.011 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 47.81 | 42.98 | 26.43 | 33.00 | 35.03 | 12.23 | 14.09 | 13.49 | 8.37 | 4.18 | 1.04 | 0.46 | 0.37 | 0.04 |
Глаг. | 33.35 | 20.94 | 27.53 | 35.30 | 19.46 | 11.36 | 10.20 | 10.82 | 8.10 | 3.09 | 1.01 | 0.24 | 0.10 | 0.01 |
Мест.-сущ. | 15.47 | 43.96 | 9.08 | 9.52 | 9.63 | 7.36 | 13.08 | 4.65 | 13.28 | 2.76 | 0.51 | 0.11 | 0.06 | 0.00 |
Предл. | 44.20 | 1.50 | 23.99 | 0.60 | 1.33 | 11.50 | 0.69 | 15.51 | 0.07 | 0.04 | 1.48 | 0.59 | 0.03 | 0.06 |
Союз | 11.35 | 17.53 | 20.52 | 7.90 | 4.43 | 4.81 | 6.92 | 5.03 | 7.01 | 2.32 | 0.36 | 0.17 | 0.07 | 0.00 |
Прилаг. | 46.99 | 3.46 | 1.91 | 2.60 | 5.56 | 6.56 | 0.92 | 0.64 | 0.70 | 0.32 | 0.12 | 0.02 | 0.02 | 0.00 |
Нареч. | 4.10 | 19.68 | 6.54 | 5.12 | 5.69 | 5.61 | 5.88 | 1.70 | 4.25 | 0.92 | 0.43 | 0.03 | 0.02 | 0.00 |
Местоим-прилаг. | 26.24 | 6.29 | 5.25 | 2.52 | 1.87 | 6.85 | 2.40 | 1.63 | 2.16 | 0.89 | 0.27 | 0.08 | 0.01 | 0.00 |
Частица | 4.25 | 21.25 | 4.97 | 3.60 | 2.40 | 1.99 | 4.04 | 2.30 | 2.45 | 1.23 | 0.20 | 0.06 | 0.01 | 0.00 |
Местоим. нареч. | 1.02 | 3.36 | 2.85 | 0.98 | 2.55 | 0.84 | 1.55 | 0.45 | 2.17 | 0.24 | 0.02 | 0.00 | 0.01 | 0.00 |
Числит. | 3.48 | 0.33 | 0.16 | 0.23 | 0.25 | 0.60 | 0.14 | 0.15 | 0.04 | 0.03 | 0.41 | 0.03 | 0.00 | 0.00 |
Числит-прилаг. | 1.11 | 0.18 | 0.09 | 0.14 | 0.08 | 0.01 | 0.04 | 0.02 | 0.08 | 0.02 | 0.00 | 0.00 | 0.00 | 0.01 |
Междомет. | 0.09 | 0.05 | 0.13 | 0.08 | 0.13 | 0.04 | 0.04 | 0.07 | 0.06 | 0.01 | 0.00 | 0.00 | 0.03 | 0.00 |
Часть комп. сложн. слова | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.07 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 14.16 | 19.39 | 21.11 | 21.97 | 23.63 |
Глаг. | 9.77 | 19.84 | 22.00 | 22.14 | 20.71 |
Мест.-сущ. | 22.23 | 17.60 | 15.65 | 13.72 | 12.62 |
Предл. | 10.94 | 6.89 | 8.83 | 10.26 | 10.28 |
Союз | 17.09 | 6.04 | 6.22 | 7.10 | 7.93 |
Прилаг. | 3.27 | 5.25 | 5.85 | 6.41 | 7.19 |
Нареч. | 8.35 | 7.42 | 6.63 | 6.04 | 5.62 |
Местоим-прилаг. | 4.33 | 6.27 | 4.85 | 5.33 | 5.39 |
Частица | 5.77 | 8.40 | 6.31 | 4.74 | 4.76 |
Местоим. нареч. | 2.86 | 1.93 | 1.68 | 1.44 | 1.08 |
Числит. | 0.40 | 0.61 | 0.60 | 0.64 | 0.57 |
Числит-прилаг. | 0.30 | 0.24 | 0.20 | 0.13 | 0.16 |
Междомет. | 0.54 | 0.10 | 0.06 | 0.01 | 0.04 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.00 | 0.04 | 0.01 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 24.54 | 24.12 | 24.72 | 23.43 | 24.65 |
Глаг. | 19.52 | 18.33 | 17.09 | 17.49 | 17.55 |
Мест.-сущ. | 11.54 | 11.07 | 10.94 | 11.24 | 11.70 |
Предл. | 10.65 | 11.14 | 11.15 | 11.86 | 10.65 |
Союз | 9.28 | 9.80 | 10.18 | 9.12 | 9.90 |
Прилаг. | 6.67 | 7.21 | 7.60 | 7.58 | 7.85 |
Нареч. | 5.15 | 5.79 | 5.75 | 5.98 | 4.99 |
Местоим-прилаг. | 5.89 | 6.03 | 5.94 | 6.39 | 6.01 |
Частица | 4.37 | 4.11 | 4.58 | 4.54 | 4.51 |
Местоим. нареч. | 1.65 | 1.53 | 1.44 | 1.56 | 1.66 |
Числит. | 0.59 | 0.75 | 0.35 | 0.62 | 0.36 |
Числит-прилаг. | 0.12 | 0.12 | 0.24 | 0.12 | 0.14 |
Междомет. | 0.00 | 0.00 | 0.02 | 0.04 | 0.00 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.00 | 0.02 | 0.02 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 23.75 | 23.63 | 22.47 | 24.41 | 23.55 |
Глаг. | 16.88 | 18.23 | 17.97 | 18.26 | 16.44 |
Мест.-сущ. | 11.03 | 11.59 | 10.99 | 10.32 | 10.64 |
Предл. | 12.67 | 11.08 | 12.59 | 10.11 | 12.32 |
Союз | 9.84 | 9.44 | 9.76 | 9.44 | 9.26 |
Прилаг. | 7.73 | 8.25 | 8.09 | 7.90 | 7.38 |
Нареч. | 5.83 | 5.62 | 5.26 | 5.63 | 5.38 |
Местоим-прилаг. | 6.16 | 5.17 | 5.98 | 6.51 | 6.95 |
Частица | 4.16 | 4.38 | 4.28 | 5.00 | 5.38 |
Местоим. нареч. | 1.27 | 1.61 | 2.05 | 1.64 | 1.84 |
Числит. | 0.53 | 0.73 | 0.41 | 0.63 | 0.67 |
Числит-прилаг. | 0.15 | 0.23 | 0.13 | 0.07 | 0.16 |
Междомет. | 0.00 | 0.03 | 0.03 | 0.03 | 0.04 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.03 | 0.00 |
Последние комментарии
1 час 55 минут назад
1 час 58 минут назад
2 дней 8 часов назад
2 дней 12 часов назад
2 дней 14 часов назад
2 дней 15 часов назад