Лингвистический анализ: Шерлок Холмс. Большой сборник (Артур Конан Дойль)


- Шерлок Холмс. Большой сборник (пер. В. Ильин, ...) (и.с. Большой сборник) 5.83 Мб, 1693с. скачать: (fb2) - (исправленную)  читать: (полностью)  - Артур Игнатиус Конан Дойль

Общая статистика

Длина текста3045742 знаков
Длина диалогов1688481 знаков
Слов в произведении (СВП)477434 слов
Приблизительно страниц1693 стр.
Средняя длина слова5.07 знаков
Предложений в произведении (ПВП)39074 предл.
Средняя длина предложения (СДП)75.10 знаков
Доля диалогов в тексте55.44 %
Доля авторского текста44.56 %
СДП диалогов76.30 знаков
СДП авторского текста97.51 знаков
Использование диалогов по тексту книги № 317444: Шерлок Холмс. Большой сборник (Артур Конан Дойль)
Максимальный фрагмент авторского текста - 13513 знаков (в страницах - примерно 8, начинается где-то с 646 страницы)

Активный словарный запас

Использовано уникальных слов52272
Активный словарный запас (АСЗ)50082
Активный не словарный запас (АНСЗ)2190
Удельный АСЗ на 3000 слов текста1455.46282543 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3737.46165553 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста19888.8849529 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 317444: Шерлок Холмс. Большой сборник (Артур Конан Дойль)
Максимальный УАСЗ-3000 (1722) наблюдается примерно на 1683 странице
Минимальный УАСЗ-3000 (1234) наблюдается примерно на 556 странице
Рост АСЗ книги № 317444: Шерлок Холмс. Большой сборник (Артур Конан Дойль)

Буквы и знаки препинания

Всего букв2415709 букв
Всего знаков препинания108389 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 58565122.67
. 3559374.55
- 485810.18
? 46859.81
! 26805.61
... 00.00
!.. 330.07
?.. 210.04
!!! 10.00
?! 300.06
" 20.00
() 1290.27
: 12862.69
; 5061.06
БукваКол-во (шт.)Частота использования (в %)
А1829787.57
Б396581.64
В1030854.27
Г422551.75
Д754623.12
Е-Ё2093098.66
Ж422551.75
З400191.66
И-Й1809737.49
К821793.40
Л1186694.91
М869523.60
Н1627356.74
О27718011.47
П638532.64
Р1024174.24
С1377485.70
Т1499726.21
У683472.83
Ф38120.16
Х219610.91
Ц76200.32
Ч376451.56
Ш198890.82
Щ73800.31
Ь-Ъ461521.91
Ы459961.90
Э110440.46
Ю136310.56
Я521542.16
Диаграма использования букв книги № 317444: Шерлок Холмс. Большой сборник (Артур Конан Дойль)

Части речи

Определенных частей речи (ОЧР)476774 слов
Не определенных частей речи (НОЧР)660 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.11630824.395
Глаг.6074118.339
Мест.-сущ.6074112.740
Предл.3095610.302
Союз423429
Прилаг.309566.493
Нареч.280655.886
Местоим-прилаг.264305.544
Частица220914.633
Местоим. нареч.82691.734
Числит.36260.761
Числит-прилаг.10330.217
Междомет.3400.071
Часть комп.
сложн. слова
230.005

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.47.5146.0426.3031.5338.1811.2514.0012.879.354.491.460.600.350.02
Глаг.33.9319.5928.3337.8618.2510.5311.0710.698.033.441.320.260.090.00
Мест.-сущ.15.2546.197.989.928.927.1312.724.5210.992.890.680.130.070.00
Предл.48.181.6722.000.501.0110.970.5615.190.150.081.920.740.030.02
Союз12.2717.1720.947.944.244.227.064.896.642.770.510.140.020.00
Прилаг.42.553.812.112.585.335.381.020.870.710.330.180.020.040.00
Нареч.4.3820.036.155.255.415.445.181.763.890.840.440.060.030.00
Местоим-прилаг.28.025.174.662.191.926.561.861.722.070.820.330.080.020.00
Частица4.5419.505.283.702.341.833.432.052.091.250.260.060.010.00
Местоим. нареч.1.283.443.191.112.640.901.650.482.190.370.070.020.000.00
Числит.4.640.470.280.320.310.600.220.160.080.040.430.050.000.00
Числит-прилаг.1.290.210.110.090.150.060.070.060.100.020.010.000.000.00
Междомет.0.090.090.070.030.110.030.030.160.050.010.000.000.040.00
Часть комп.
сложн. слова
0.010.000.000.000.000.030.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.13.5018.1820.5022.9624.02
Глаг.9.8123.2423.5221.6720.52
Мест.-сущ.22.4316.6214.1913.7311.99
Предл.10.036.699.6210.2310.54
Союз17.105.696.587.298.78
Прилаг.3.144.585.315.986.47
Нареч.8.057.966.765.715.62
Местоим-прилаг.4.415.934.865.285.48
Частица6.607.765.904.614.09
Местоим. нареч.3.522.151.771.521.42
Числит.0.550.740.750.810.87
Числит-прилаг.0.250.350.210.180.18
Междомет.0.590.080.030.010.02
Часть комп.
сложн. слова
0.000.010.000.010.00

Номер слова в предложении
678910
Сущ.24.7824.8625.5825.0225.11
Глаг.18.9818.4717.7017.6817.76
Мест.-сущ.11.3611.1611.2910.6010.64
Предл.11.2411.4011.4611.8311.55
Союз9.309.769.479.789.83
Прилаг.6.727.127.096.967.20
Нареч.5.194.944.915.295.36
Местоим-прилаг.5.665.755.905.985.81
Частица4.074.034.094.214.20
Местоим. нареч.1.541.391.631.601.62
Числит.0.920.880.650.870.73
Числит-прилаг.0.210.220.210.150.17
Междомет.0.020.020.020.000.02
Часть комп.
сложн. слова
0.000.000.000.010.01

Номер слова в предложении
1112131415
Сущ.24.4324.7323.7124.2324.64
Глаг.18.1817.7717.5417.3017.12
Мест.-сущ.10.8310.9311.0810.9510.44
Предл.11.7511.7112.0511.9212.20
Союз9.489.339.609.358.80
Прилаг.7.387.447.708.038.11
Нареч.5.025.245.275.095.35
Местоим-прилаг.5.886.015.926.446.52
Частица4.364.184.453.974.21
Местоим. нареч.1.651.521.801.751.55
Числит.0.820.880.720.790.79
Числит-прилаг.0.180.220.130.120.25
Междомет.0.020.030.010.040.02
Часть комп.
сложн. слова
0.010.010.010.010.00