Лингвистический анализ: Приключения Шерлока Холмса (сборник) (Артур Конан Дойль)


- Приключения Шерлока Холмса (сборник) (пер. Николай Корнеевич Чуковский, ...) (и.с. 100 Главных книг) 2.49 Мб, 616с. скачать: (fb2) (исправленную)  читать: (полностью)  - Артур Игнатиус Конан Дойль

Общая статистика

Длина текста1108610 знаков
Длина диалогов549161 знаков
Слов в произведении (СВП)173694 слов
Приблизительно страниц616 стр.
Средняя длина слова5.07 знаков
Предложений в произведении (ПВП)13406 предл.
Средняя длина предложения (СДП)79.86 знаков
Доля диалогов в тексте49.54 %
Доля авторского текста50.46 %
СДП диалогов79.85 знаков
СДП авторского текста102.18 знаков
Использование диалогов по тексту книги № 322497: Приключения Шерлока Холмса (сборник) (Артур Конан Дойль)
Максимальный фрагмент авторского текста - 26362 знаков (в страницах - примерно 15, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов29074
Активный словарный запас (АСЗ)28294
Активный не словарный запас (АНСЗ)780
Удельный АСЗ на 3000 слов текста1461.09397522 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3762.79355167 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста20278.4857774 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 322497: Приключения Шерлока Холмса (сборник) (Артур Конан Дойль)
Максимальный УАСЗ-3000 (1806) наблюдается примерно на 610 странице
Минимальный УАСЗ-3000 (1244) наблюдается примерно на 472 странице
Рост АСЗ книги № 322497: Приключения Шерлока Холмса (сборник) (Артур Конан Дойль)

Буквы и знаки препинания

Всего букв879872 букв
Всего знаков препинания38625 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 20942120.57
. 1221470.32
- 184810.64
? 16809.67
! 11196.44
... 00.00
!.. 160.09
?.. 100.06
!!! 00.00
?! 110.06
" 00.00
() 680.39
: 4942.84
; 2231.28
БукваКол-во (шт.)Частота использования (в %)
А668267.59
Б146851.67
В377304.29
Г153611.75
Д275933.14
Е-Ё766448.71
Ж153611.75
З145851.66
И-Й654107.43
К295393.36
Л429514.88
М312953.56
Н587686.68
О10008211.37
П230752.62
Р377594.29
С499065.67
Т550116.25
У248282.82
Ф14060.16
Х81280.92
Ц27480.31
Ч136341.55
Ш73380.83
Щ26540.30
Ь-Ъ171921.95
Ы168731.92
Э42990.49
Ю50540.57
Я193412.20
Диаграма использования букв книги № 322497: Приключения Шерлока Холмса (сборник) (Артур Конан Дойль)

Части речи

Определенных частей речи (ОЧР)173544 слов
Не определенных частей речи (НОЧР)150 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4217624.303
Глаг.2192718.215
Мест.-сущ.2192712.635
Предл.1131910.419
Союз152769
Прилаг.113196.522
Нареч.102815.924
Местоим-прилаг.99635.741
Частица79414.576
Местоим. нареч.31291.803
Числит.13510.778
Числит-прилаг.3640.210
Междомет.1220.070
Часть комп.
сложн. слова
30.002

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.47.0145.2625.1931.5138.9111.2414.3013.548.924.811.450.520.360.01
Глаг.32.4019.9128.0038.6217.4410.5310.9811.067.963.561.340.270.080.00
Мест.-сущ.15.0345.318.089.888.476.9113.254.7710.832.930.690.140.060.00
Предл.48.111.7522.230.521.0911.260.5215.700.120.092.020.730.030.01
Союз12.3516.8520.097.904.104.257.514.836.552.900.530.150.020.00
Прилаг.43.463.542.072.545.125.401.010.890.600.390.160.010.030.00
Нареч.3.8720.626.365.545.355.474.941.713.920.890.450.070.040.00
Местоим-прилаг.29.015.275.012.282.036.741.761.922.160.810.340.060.020.00
Частица4.4319.185.593.792.101.832.981.992.331.190.240.080.020.00
Местоим. нареч.1.303.693.231.172.840.881.690.592.160.400.070.010.000.00
Числит.4.700.460.300.340.370.610.220.150.060.040.480.050.000.00
Числит-прилаг.1.230.210.120.090.120.060.040.070.100.020.020.010.000.01
Междомет.0.090.090.060.010.100.030.030.180.050.010.000.010.050.00
Часть комп.
сложн. слова
0.010.000.000.000.000.010.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.13.1218.4320.5222.9223.44
Глаг.9.6622.4223.7522.3120.57
Мест.-сущ.22.3616.6314.5313.5811.77
Предл.10.276.769.5210.3210.87
Союз17.235.446.096.808.75
Прилаг.3.124.915.245.746.18
Нареч.8.057.916.815.855.63
Местоим-прилаг.4.256.254.955.385.85
Частица6.797.855.824.384.30
Местоим. нареч.3.712.201.711.661.57
Числит.0.580.800.800.860.88
Числит-прилаг.0.260.340.230.180.16
Междомет.0.610.070.030.030.04
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.24.6125.0225.0324.4925.02
Глаг.19.0918.4317.8517.6518.01
Мест.-сущ.11.6210.7411.7710.4210.58
Предл.10.8911.0711.4111.9111.61
Союз9.0610.049.8510.169.77
Прилаг.6.417.026.866.767.11
Нареч.5.375.115.175.625.37
Местоим-прилаг.5.965.935.966.105.91
Частица4.124.013.584.083.92
Местоим. нареч.1.641.461.731.831.85
Числит.0.950.900.510.820.71
Числит-прилаг.0.260.240.240.140.11
Междомет.0.020.030.020.010.01
Часть комп.
сложн. слова
0.010.000.010.000.00

Номер слова в предложении
1112131415
Сущ.24.3124.2223.9324.0623.60
Глаг.17.7617.7717.4517.6016.95
Мест.-сущ.10.6210.7211.6310.7610.59
Предл.11.8711.6811.9011.9212.90
Союз9.939.119.499.048.45
Прилаг.7.237.927.478.257.86
Нареч.5.075.515.445.235.50
Местоим-прилаг.6.166.195.886.007.09
Частица4.194.174.274.164.38
Местоим. нареч.1.731.451.681.891.59
Числит.0.881.090.750.990.84
Числит-прилаг.0.190.130.110.100.25
Междомет.0.040.050.000.000.00
Часть комп.
сложн. слова
0.000.000.000.000.00