Лингвистический анализ: Великая Гражданская война 1939-1945 (Андрей Буровский)


- Великая Гражданская война 1939-1945 (а.с. Великая отечественная: Неизвестная война) 1.74 Мб, 491с. скачать: (fb2) (исправленную)  читать: (полностью)  - Андрей Михайлович Буровский

Общая статистика

Длина текста882433 знаков
Длина диалогов4770 знаков
Слов в произведении (СВП)120868 слов
Приблизительно страниц491 стр.
Средняя длина слова5.88 знаков
Предложений в произведении (ПВП)10347 предл.
Средняя длина предложения (СДП)82.35 знаков
Доля диалогов в тексте0.54 %
Доля авторского текста99.46 %
СДП диалогов182.50 знаков
СДП авторского текста85.42 знаков
Использование диалогов по тексту книги № 107984: Великая Гражданская война 1939-1945 (Андрей Буровский)
Максимальный фрагмент авторского текста - 242744 знаков (в страницах - примерно 135, начинается где-то с 353 страницы)

Активный словарный запас

Использовано уникальных слов25419
Активный словарный запас (АСЗ)23878
Активный не словарный запас (АНСЗ)1541
Удельный АСЗ на 3000 слов текста1582.21247543 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4195.68227095 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста22478.0935050 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 107984: Великая Гражданская война 1939-1945 (Андрей Буровский)
Максимальный УАСЗ-3000 (1707) наблюдается примерно на 308 странице
Минимальный УАСЗ-3000 (1415) наблюдается примерно на 296 странице
Рост АСЗ книги № 107984: Великая Гражданская война 1939-1945 (Андрей Буровский)

Буквы и знаки препинания

Всего букв708024 букв
Всего знаков препинания22467 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 889373.58
. 1036885.78
- 9227.63
? 3683.04
! 2912.41
... 00.00
!.. 00.00
?.. 00.00
!!! 60.05
?! 380.31
" 00.00
() 7626.30
: 6955.75
; 1241.03
БукваКол-во (шт.)Частота использования (в %)
А576988.15
Б111411.57
В362095.11
Г134001.89
Д193702.74
Е-Ё559047.90
Ж134001.89
З98121.39
И-Й7098910.03
К234413.31
Л317174.48
М210962.98
Н478526.76
О7479910.56
П184642.61
Р375055.30
С428716.06
Т409105.78
У154602.18
Ф24380.34
Х73281.03
Ц52570.74
Ч89831.27
Ш42200.60
Щ17380.25
Ь-Ъ110571.56
Ы134511.90
Э18530.26
Ю48550.69
Я126711.79
Диаграма использования букв книги № 107984: Великая Гражданская война 1939-1945 (Андрей Буровский)

Части речи

Определенных частей речи (ОЧР)120015 слов
Не определенных частей речи (НОЧР)853 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4713839.277
Глаг.477513.616
Мест.-сущ.47753.979
Предл.1326212.271
Союз84237
Прилаг.1326211.050
Нареч.46703.891
Местоим-прилаг.41453.454
Частица41973.497
Местоим. нареч.9970.831
Числит.4900.408
Числит-прилаг.6730.561
Междомет.290.024
Часть комп.
сложн. слова
1480.123

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.127.8262.8212.9065.7041.6236.9615.2511.0310.983.501.082.410.120.57
Глаг.36.3315.905.8730.1110.1616.417.215.765.911.020.800.520.040.12
Мест.-сущ.8.6511.981.192.763.143.562.871.004.030.470.040.080.000.01
Предл.78.311.459.471.150.8618.070.739.280.210.071.151.730.020.20
Союз22.3010.424.318.052.528.254.473.134.661.410.170.370.000.12
Прилаг.84.103.350.853.424.6911.260.840.580.820.270.070.090.040.12
Нареч.5.0511.421.524.512.824.843.421.292.870.710.370.090.010.00
Местоим-прилаг.17.513.501.821.921.044.900.870.701.820.190.110.110.000.04
Частица5.4813.601.114.231.372.772.441.481.650.530.180.100.020.01
Местоим. нареч.0.771.520.570.581.740.320.660.161.870.070.020.020.000.00
Числит.2.770.120.080.080.120.630.050.080.020.020.040.070.000.00
Числит-прилаг.3.260.080.070.170.091.670.040.030.110.040.030.000.000.00
Междомет.0.120.010.020.020.000.020.020.000.020.010.000.000.000.00
Часть комп.
сложн. слова
0.300.000.010.010.020.840.020.000.000.000.000.000.000.03

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.29.2639.1337.4936.8437.44
Глаг.5.8715.2616.9918.1016.88
Мест.-сущ.7.226.204.583.783.28
Предл.20.438.8010.7311.9811.95
Союз11.964.764.975.556.55
Прилаг.8.218.8410.1410.8211.22
Нареч.6.014.504.534.214.09
Местоим-прилаг.4.424.503.383.523.41
Частица3.265.085.143.513.42
Местоим. нареч.2.221.290.770.720.65
Числит.0.320.400.380.350.37
Числит-прилаг.0.691.090.770.500.61
Междомет.0.050.000.000.000.01
Часть комп.
сложн. слова
0.070.160.120.100.11

Номер слова в предложении
678910
Сущ.37.2737.9437.9037.2238.04
Глаг.15.5615.2515.1814.3314.30
Мест.-сущ.3.253.593.573.123.70
Предл.12.3712.1012.0012.8912.89
Союз7.026.977.477.627.66
Прилаг.11.4811.4411.3411.8711.80
Нареч.4.103.883.683.563.23
Местоим-прилаг.3.623.063.213.663.23
Частица3.453.933.843.803.19
Местоим. нареч.0.760.760.720.830.60
Числит.0.340.380.500.450.52
Числит-прилаг.0.620.560.470.560.62
Междомет.0.000.010.000.000.02
Часть комп.
сложн. слова
0.160.130.120.090.19

Номер слова в предложении
1112131415
Сущ.37.7438.2038.3738.8637.50
Глаг.13.7012.6011.8912.3912.09
Мест.-сущ.3.803.814.043.704.46
Предл.12.9812.5013.0512.7813.43
Союз7.638.227.918.168.78
Прилаг.12.2212.6513.3712.7112.59
Нареч.3.043.322.903.082.98
Местоим-прилаг.3.303.323.643.243.01
Частица3.563.323.073.313.20
Местоим. нареч.0.630.690.630.490.72
Числит.0.570.720.510.360.76
Числит-прилаг.0.680.400.370.620.27
Междомет.0.020.020.110.000.00
Часть комп.
сложн. слова
0.130.220.140.290.19