Лингвистический анализ: Гайдзин (Джеймс Клавелл)


- Гайдзин (пер. Е. А. Куприн) 4.81 Мб, 1477с. скачать: (fb2) (исправленную)  читать: (полностью)  - Джеймс Клавелл

Общая статистика

Длина текста2656953 знаков
Длина диалогов1429837 знаков
Слов в произведении (СВП)412507 слов
Приблизительно страниц1477 стр.
Средняя длина слова5.10 знаков
Предложений в произведении (ПВП)35288 предл.
Средняя длина предложения (СДП)72.46 знаков
Доля диалогов в тексте53.81 %
Доля авторского текста46.19 %
СДП диалогов63.76 знаков
СДП авторского текста99.48 знаков
Использование диалогов по тексту книги № 307240: Гайдзин (Джеймс Клавелл)
Максимальный фрагмент авторского текста - 16680 знаков (в страницах - примерно 9, начинается где-то с 314 страницы)

Активный словарный запас

Использовано уникальных слов46330
Активный словарный запас (АСЗ)44794
Активный не словарный запас (АНСЗ)1536
Удельный АСЗ на 3000 слов текста1477.16306292 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3844.44277902 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста19864.6755838 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 307240: Гайдзин (Джеймс Клавелл)
Максимальный УАСЗ-3000 (1663) наблюдается примерно на 229 странице
Минимальный УАСЗ-3000 (1216) наблюдается примерно на 1288 странице
Рост АСЗ книги № 307240: Гайдзин (Джеймс Клавелл)

Буквы и знаки препинания

Всего букв2102683 букв
Всего знаков препинания98449 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 56930138.01
. 2775067.27
- 34148.28
? 421410.22
! 15573.77
... 21965.32
!.. 50.01
?.. 90.02
!!! 10.00
?! 110.03
" 420.10
() 790.19
: 17204.17
; 5211.26
БукваКол-во (шт.)Частота использования (в %)
А1707968.12
Б378481.80
В864424.11
Г416021.98
Д651483.10
Е-Ё1766798.40
Ж416021.98
З344961.64
И-Й1644517.82
К666213.17
Л995464.73
М714703.40
Н1396636.64
О24020511.42
П595742.83
Р927504.41
С1135815.40
Т1279886.09
У608932.90
Ф31340.15
Х180130.86
Ц72410.34
Ч297171.41
Ш166130.79
Щ67230.32
Ь-Ъ427082.03
Ы404681.92
Э92030.44
Ю115000.55
Я442072.10
Диаграма использования букв книги № 307240: Гайдзин (Джеймс Клавелл)

Части речи

Определенных частей речи (ОЧР)411746 слов
Не определенных частей речи (НОЧР)761 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.10187824.743
Глаг.5202018.805
Мест.-сущ.5202012.634
Предл.252949.853
Союз372209
Прилаг.252946.143
Нареч.264156.415
Местоим-прилаг.208555.065
Частица177064.300
Местоим. нареч.75281.828
Числит.32560.791
Числит-прилаг.8510.207
Междомет.4970.121
Часть комп.
сложн. слова
2280.055

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.49.2949.2324.4431.8137.1210.8916.2012.418.155.001.720.510.450.20
Глаг.36.7420.6232.6135.3217.8710.8212.609.166.763.791.180.310.160.10
Мест.-сущ.18.5342.667.328.7210.667.1912.334.0010.663.130.850.160.120.02
Предл.46.751.5221.440.591.3011.060.8112.260.190.101.560.650.190.09
Союз14.5718.8420.126.354.874.106.875.006.212.480.720.130.060.07
Прилаг.38.844.592.492.885.283.571.231.040.860.380.170.030.040.02
Нареч.6.5121.346.025.686.374.466.172.343.481.060.580.080.050.02
Местоим-прилаг.23.865.214.342.871.875.622.291.751.700.630.370.090.030.01
Частица4.4519.554.242.632.022.053.121.781.721.150.210.040.040.01
Местоим. нареч.1.333.302.801.142.310.952.200.563.070.480.100.020.020.00
Числит.4.790.670.280.330.380.460.250.190.070.030.420.040.000.00
Числит-прилаг.1.300.170.110.130.090.100.030.030.070.010.020.010.000.00
Междомет.0.390.130.100.050.180.100.040.100.050.040.000.000.040.00
Часть комп.
сложн. слова
0.080.210.040.030.070.040.020.030.010.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.19.7820.7721.3523.2423.94
Глаг.9.4327.0224.9921.0719.99
Мест.-сущ.24.7612.9412.3613.4012.40
Предл.8.735.669.5210.7710.71
Союз11.915.237.438.029.03
Прилаг.3.635.205.475.886.19
Нареч.7.638.546.575.976.07
Местоим-прилаг.4.234.534.234.454.68
Частица4.766.605.464.404.33
Местоим. нареч.2.832.081.591.571.71
Числит.1.070.820.710.860.64
Числит-прилаг.0.220.320.190.210.20
Междомет.0.890.240.100.090.06
Часть комп.
сложн. слова
0.130.060.030.070.04

Номер слова в предложении
678910
Сущ.24.4024.1424.8624.3224.51
Глаг.19.4219.2918.2918.8317.86
Мест.-сущ.12.1911.1511.0611.4611.43
Предл.10.8510.8611.0811.5111.86
Союз9.099.829.989.509.60
Прилаг.6.196.636.376.406.66
Нареч.5.765.955.865.705.71
Местоим-прилаг.5.105.185.375.335.49
Частица4.093.984.224.063.81
Местоим. нареч.1.861.911.821.931.83
Числит.0.760.750.750.710.88
Числит-прилаг.0.190.190.210.140.23
Междомет.0.060.080.070.080.08
Часть комп.
сложн. слова
0.040.060.050.040.04

Номер слова в предложении
1112131415
Сущ.24.7324.4523.9023.6724.83
Глаг.18.5717.9818.2118.0117.35
Мест.-сущ.10.9310.8710.9711.1010.51
Предл.11.2511.0011.2711.3211.26
Союз9.9510.5510.2710.329.71
Прилаг.6.316.587.187.057.45
Нареч.5.965.835.955.495.91
Местоим-прилаг.5.545.825.485.925.81
Частица3.894.084.144.334.40
Местоим. нареч.1.721.811.701.781.53
Числит.0.920.720.690.760.95
Числит-прилаг.0.170.210.180.170.17
Междомет.0.050.030.040.040.08
Часть комп.
сложн. слова
0.020.070.030.040.03