Лингвистический анализ: Записки о Шерлоке Холмсе (Артур Конан Дойль)
Общая статистика
Длина текста | 1071220 знаков |
Длина диалогов | 555335 знаков |
Слов в произведении (СВП) | 168003 слов |
Приблизительно страниц | 596 стр. |
Средняя длина слова | 5.07 знаков |
Предложений в произведении (ПВП) | 13240 предл. |
Средняя длина предложения (СДП) | 78.08 знаков |
Доля диалогов в тексте | 51.84 % |
Доля авторского текста | 48.16 % |
СДП диалогов | 81.05 знаков |
СДП авторского текста | 100.87 знаков |
|
Максимальный фрагмент авторского текста - 15085 знаков (в страницах - примерно 8, начинается где-то с 282 страницы) |
Активный словарный запас
Использовано уникальных слов | 27235 | |
Активный словарный запас (АСЗ) | 26457 | |
Активный не словарный запас (АНСЗ) | 778 | |
Удельный АСЗ на 3000 слов текста | 1442.42 | 284407 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3692.45 | 225789 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 19520.13 | 8945 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1676) наблюдается примерно на 592 странице |
Минимальный УАСЗ-3000 (1270) наблюдается примерно на 414 странице |
|
Буквы и знаки препинания
Всего букв | 850981 букв |
Всего знаков препинания | 37146 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 19942 | 118.70 |
. | 11814 | 70.32 |
- | 1848 | 11.00 |
? | 1710 | 10.18 |
! | 1042 | 6.20 |
... | 0 | 0.00 |
!.. | 13 | 0.08 |
?.. | 7 | 0.04 |
!!! | 0 | 0.00 |
?! | 5 | 0.03 |
" | 0 | 0.00 |
() | 59 | 0.35 |
: | 530 | 3.15 |
; | 176 | 1.05 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 64594 | 7.59 |
Б | 13887 | 1.63 |
В | 36487 | 4.29 |
Г | 15012 | 1.76 |
Д | 26554 | 3.12 |
Е-Ё | 74390 | 8.74 |
Ж | 15012 | 1.76 |
З | 14050 | 1.65 |
И-Й | 63361 | 7.45 |
К | 28956 | 3.40 |
Л | 41644 | 4.89 |
М | 30951 | 3.64 |
Н | 56904 | 6.69 |
О | 97120 | 11.41 |
П | 22256 | 2.62 |
Р | 36040 | 4.24 |
С | 48157 | 5.66 |
Т | 53570 | 6.30 |
У | 23834 | 2.80 |
Ф | 1188 | 0.14 |
Х | 7906 | 0.93 |
Ц | 2610 | 0.31 |
Ч | 13153 | 1.55 |
Ш | 7087 | 0.83 |
Щ | 2561 | 0.30 |
Ь-Ъ | 16416 | 1.93 |
Ы | 16302 | 1.92 |
Э | 4243 | 0.50 |
Ю | 4739 | 0.56 |
Я | 18363 | 2.16 |
|
Части речи
Определенных частей речи (ОЧР) | 167915 слов |
Не определенных частей речи (НОЧР) | 88 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 41397 | 24.654 |
Глаг. | 21216 | 17.951 |
Мест.-сущ. | 21216 | 12.635 |
Предл. | 10932 | 10.529 |
Союз | 14649 | 9 |
Прилаг. | 10932 | 6.510 |
Нареч. | 9545 | 5.684 |
Местоим-прилаг. | 10006 | 5.959 |
Частица | 7478 | 4.453 |
Местоим. нареч. | 3076 | 1.832 |
Числит. | 1304 | 0.777 |
Числит-прилаг. | 368 | 0.219 |
Междомет. | 116 | 0.069 |
Часть комп. сложн. слова | 6 | 0.004 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 49.79 | 45.61 | 25.41 | 32.21 | 38.32 | 11.12 | 13.81 | 14.19 | 8.88 | 4.72 | 1.49 | 0.60 | 0.38 | 0.01 |
Глаг. | 31.15 | 19.28 | 27.79 | 38.79 | 17.05 | 10.18 | 10.61 | 11.20 | 7.95 | 3.85 | 1.36 | 0.21 | 0.08 | 0.00 |
Мест.-сущ. | 15.73 | 45.31 | 7.53 | 10.02 | 8.90 | 7.12 | 12.51 | 4.75 | 10.65 | 2.95 | 0.63 | 0.17 | 0.07 | 0.00 |
Предл. | 47.70 | 1.85 | 22.91 | 0.57 | 1.08 | 10.83 | 0.60 | 16.70 | 0.15 | 0.07 | 1.97 | 0.80 | 0.04 | 0.02 |
Союз | 12.02 | 16.60 | 20.77 | 7.93 | 4.21 | 3.98 | 6.83 | 5.00 | 6.27 | 2.90 | 0.57 | 0.14 | 0.02 | 0.00 |
Прилаг. | 43.37 | 3.20 | 2.05 | 2.66 | 5.13 | 5.58 | 1.01 | 0.82 | 0.64 | 0.39 | 0.20 | 0.01 | 0.04 | 0.00 |
Нареч. | 4.14 | 19.42 | 5.79 | 5.44 | 5.01 | 5.56 | 4.99 | 1.66 | 3.47 | 0.81 | 0.47 | 0.07 | 0.01 | 0.00 |
Местоим-прилаг. | 30.27 | 5.63 | 4.82 | 2.33 | 1.89 | 7.30 | 1.81 | 2.09 | 2.13 | 0.94 | 0.30 | 0.07 | 0.01 | 0.00 |
Частица | 4.45 | 18.36 | 5.62 | 3.75 | 1.97 | 1.78 | 2.86 | 2.19 | 2.04 | 1.21 | 0.23 | 0.08 | 0.01 | 0.00 |
Местоим. нареч. | 1.39 | 3.61 | 3.25 | 1.23 | 3.14 | 0.95 | 1.53 | 0.55 | 2.17 | 0.41 | 0.08 | 0.00 | 0.00 | 0.00 |
Числит. | 5.09 | 0.31 | 0.23 | 0.28 | 0.33 | 0.60 | 0.18 | 0.17 | 0.06 | 0.04 | 0.45 | 0.04 | 0.00 | 0.00 |
Числит-прилаг. | 1.32 | 0.23 | 0.11 | 0.07 | 0.13 | 0.07 | 0.07 | 0.06 | 0.10 | 0.02 | 0.01 | 0.01 | 0.00 | 0.00 |
Междомет. | 0.08 | 0.10 | 0.07 | 0.03 | 0.10 | 0.02 | 0.02 | 0.21 | 0.03 | 0.01 | 0.00 | 0.01 | 0.02 | 0.00 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 13.49 | 18.78 | 20.61 | 23.18 | 23.91 |
Глаг. | 9.25 | 22.88 | 23.42 | 22.19 | 19.79 |
Мест.-сущ. | 22.18 | 16.59 | 14.50 | 13.77 | 11.89 |
Предл. | 10.40 | 6.86 | 9.59 | 10.02 | 11.25 |
Союз | 17.24 | 5.52 | 6.04 | 6.73 | 8.67 |
Прилаг. | 3.01 | 4.51 | 5.34 | 5.82 | 6.39 |
Нареч. | 8.06 | 7.69 | 6.58 | 5.62 | 5.45 |
Местоим-прилаг. | 4.38 | 6.30 | 5.39 | 5.50 | 5.89 |
Частица | 6.88 | 7.38 | 5.80 | 4.36 | 4.12 |
Местоим. нареч. | 3.80 | 2.22 | 1.69 | 1.67 | 1.65 |
Числит. | 0.45 | 0.82 | 0.76 | 0.96 | 0.82 |
Числит-прилаг. | 0.29 | 0.38 | 0.25 | 0.15 | 0.12 |
Междомет. | 0.57 | 0.06 | 0.03 | 0.03 | 0.05 |
Часть комп. сложн. слова | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 24.85 | 26.30 | 25.24 | 24.96 | 24.67 |
Глаг. | 18.47 | 18.11 | 17.34 | 17.29 | 17.59 |
Мест.-сущ. | 11.40 | 10.85 | 11.33 | 10.67 | 10.73 |
Предл. | 11.14 | 11.16 | 11.86 | 12.27 | 11.69 |
Союз | 8.98 | 9.65 | 9.93 | 9.78 | 10.08 |
Прилаг. | 6.68 | 6.96 | 7.01 | 6.40 | 6.90 |
Нареч. | 5.21 | 4.67 | 4.37 | 5.38 | 5.21 |
Местоим-прилаг. | 6.22 | 5.71 | 6.50 | 6.63 | 6.60 |
Частица | 4.06 | 3.84 | 3.84 | 3.90 | 3.69 |
Местоим. нареч. | 1.71 | 1.56 | 1.67 | 1.74 | 1.99 |
Числит. | 1.01 | 0.91 | 0.73 | 0.79 | 0.69 |
Числит-прилаг. | 0.22 | 0.25 | 0.16 | 0.18 | 0.14 |
Междомет. | 0.04 | 0.03 | 0.02 | 0.00 | 0.01 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 24.70 | 23.97 | 24.15 | 24.46 | 24.16 |
Глаг. | 17.60 | 18.36 | 17.05 | 17.15 | 16.95 |
Мест.-сущ. | 11.17 | 10.86 | 11.44 | 11.14 | 10.37 |
Предл. | 11.83 | 11.86 | 12.19 | 11.99 | 12.40 |
Союз | 9.20 | 9.14 | 9.07 | 9.22 | 8.52 |
Прилаг. | 7.12 | 7.50 | 7.96 | 7.65 | 8.33 |
Нареч. | 5.41 | 5.00 | 5.07 | 5.05 | 5.34 |
Местоим-прилаг. | 6.23 | 6.69 | 6.35 | 6.71 | 7.06 |
Частица | 3.86 | 3.88 | 4.38 | 3.91 | 4.14 |
Местоим. нареч. | 1.75 | 1.59 | 1.55 | 1.75 | 1.51 |
Числит. | 0.89 | 0.90 | 0.65 | 0.88 | 0.84 |
Числит-прилаг. | 0.22 | 0.22 | 0.10 | 0.06 | 0.34 |
Междомет. | 0.03 | 0.03 | 0.04 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.02 | 0.02 |
Последние комментарии
1 день 18 часов назад
1 день 23 часов назад
2 дней 46 минут назад
2 дней 2 часов назад
2 дней 3 часов назад
2 дней 4 часов назад