Лингвистический анализ: Из сборника «Четыре миллиона» (О Генри)


- Из сборника «Четыре миллиона» (пер. Евгения Давыдовна Калашникова, ...) (а.с. Генри, О. Сборники (авторские)) 152 Кб, 83с. скачать: (fb2) (исправленную)  читать: (полностью)  - О. Генри

Общая статистика

Длина текста147683 знаков
Длина диалогов41421 знаков
Слов в произведении (СВП)22717 слов
Приблизительно страниц83 стр.
Средняя длина слова5.22 знаков
Предложений в произведении (ПВП)1615 предл.
Средняя длина предложения (СДП)88.53 знаков
Доля диалогов в тексте28.05 %
Доля авторского текста71.95 %
СДП диалогов72.84 знаков
СДП авторского текста101.22 знаков
Использование диалогов по тексту книги № 36631: Из сборника «Четыре миллиона» (О Генри)
Максимальный фрагмент авторского текста - 8655 знаков (в страницах - примерно 5, начинается где-то с 51 страницы)

Активный словарный запас

Использовано уникальных слов8219
Активный словарный запас (АСЗ)8053
Активный не словарный запас (АНСЗ)166
Удельный АСЗ на 3000 слов текста1578.26203587 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4283.91360451 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 36631: Из сборника «Четыре миллиона» (О Генри)
Максимальный УАСЗ-3000 (1658) наблюдается примерно на 43 странице
Минимальный УАСЗ-3000 (1500) наблюдается примерно на 33 странице
Рост АСЗ книги № 36631: Из сборника «Четыре миллиона» (О Генри)

Буквы и знаки препинания

Всего букв118550 букв
Всего знаков препинания4832 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 2658117.00
. 160470.61
- 24210.65
? 1145.02
! 1004.40
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 10.04
" 00.00
() 130.57
: 482.11
; 522.29
БукваКол-во (шт.)Частота использования (в %)
А98878.34
Б20301.71
В50174.23
Г20781.75
Д39543.34
Е-Ё98708.33
Ж20781.75
З20811.76
И-Й97588.23
К44513.75
Л60915.14
М39283.31
Н75606.38
О1262010.65
П31672.67
Р50934.30
С65245.50
Т69245.84
У34472.91
Ф2150.18
Х9180.77
Ц4820.41
Ч17161.45
Ш10070.85
Щ3470.29
Ь-Ъ22971.94
Ы23091.95
Э4970.42
Ю6880.58
Я23251.96
Диаграма использования букв книги № 36631: Из сборника «Четыре миллиона» (О Генри)

Части речи

Определенных частей речи (ОЧР)22705 слов
Не определенных частей речи (НОЧР)12 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.647028.496
Глаг.220317.415
Мест.-сущ.22039.703
Предл.179110.998
Союз18668
Прилаг.17917.888
Нареч.11725.162
Местоим-прилаг.10714.717
Частица9554.206
Местоим. нареч.3431.511
Числит.2831.246
Числит-прилаг.660.291
Междомет.340.150
Часть комп.
сложн. слова
00.000

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.61.7054.9222.9042.6842.7216.3413.1212.0710.044.802.290.570.790.00
Глаг.39.2418.8922.9537.8312.9012.079.168.687.492.641.890.090.310.00
Мест.-сущ.13.3931.625.558.815.556.4710.753.668.542.030.440.090.130.00
Предл.56.381.8117.180.790.6215.280.6212.600.000.133.171.370.040.00
Союз16.4318.0612.686.252.076.126.303.706.962.600.790.130.090.00
Прилаг.53.953.661.632.425.998.100.840.970.620.220.400.000.040.00
Нареч.4.3619.733.445.115.113.883.961.542.690.750.920.130.000.00
Местоим-прилаг.22.864.893.352.251.676.741.321.191.540.660.480.220.000.00
Частица4.5817.044.322.642.382.253.041.982.380.880.530.000.040.00
Местоим. нареч.1.102.952.470.752.330.922.290.441.540.220.090.000.000.00
Числит.8.190.180.350.310.570.660.130.180.040.091.450.310.000.00
Числит-прилаг.2.470.180.090.090.040.040.000.000.000.000.000.000.000.00
Междомет.0.310.220.130.000.220.000.090.180.220.090.000.000.040.00
Часть комп.
сложн. слова
0.000.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.19.0322.1925.2126.6925.77
Глаг.8.7624.1823.4320.8120.83
Мест.-сущ.19.4712.8011.029.799.66
Предл.11.287.728.7111.7011.24
Союз14.305.215.026.027.87
Прилаг.4.664.895.746.988.09
Нареч.5.806.886.405.614.94
Местоим-прилаг.3.915.085.024.315.08
Частица7.697.075.684.383.15
Местоим. нареч.3.092.061.391.511.29
Числит.1.321.411.911.781.72
Числит-прилаг.0.060.450.400.270.29
Междомет.0.630.060.070.140.07
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.27.4629.4129.2326.3028.00
Глаг.18.0017.4619.7215.9017.49
Мест.-сущ.9.088.988.549.347.40
Предл.12.4310.8710.4813.3912.34
Союз9.008.818.987.909.55
Прилаг.7.558.817.229.838.58
Нареч.5.345.024.496.743.97
Местоим-прилаг.4.504.534.754.344.94
Частица3.813.874.313.284.61
Местоим. нареч.1.301.071.141.641.72
Числит.1.300.660.790.871.07
Числит-прилаг.0.150.330.350.290.11
Междомет.0.080.160.000.190.21
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
1112131415
Сущ.29.1625.3026.2025.6429.40
Глаг.16.2915.3618.9215.3816.55
Мест.-сущ.8.628.218.889.949.15
Предл.11.4514.5711.0612.029.15
Союз8.9710.078.449.948.63
Прилаг.9.689.808.599.789.86
Нареч.4.964.644.804.174.93
Местоим-прилаг.4.255.306.554.176.16
Частица3.194.374.375.772.99
Местоим. нареч.1.421.720.581.761.58
Числит.1.650.400.871.281.06
Числит-прилаг.0.120.260.440.160.35
Междомет.0.240.000.290.000.18
Часть комп.
сложн. слова
0.000.000.000.000.00