Лингвистический анализ: Черная книга коммунизма (Николя Верт)


- Черная книга коммунизма 6.89 Мб, 1195с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Николя Верт - Стефан Куртуа - Жан-Луи Панне - Анджей Пачковский - Карел Бартошек

Общая статистика

Длина текста2150334 знаков
Длина диалогов13217 знаков
Слов в произведении (СВП)279113 слов
Приблизительно страниц1195 стр.
Средняя длина слова6.32 знаков
Предложений в произведении (ПВП)14597 предл.
Средняя длина предложения (СДП)144.35 знаков
Доля диалогов в тексте0.61 %
Доля авторского текста99.39 %
СДП диалогов180.07 знаков
СДП авторского текста141.40 знаков
Использование диалогов по тексту книги № 314330: Черная книга коммунизма (Николя Верт)
Максимальный фрагмент авторского текста - 496835 знаков (в страницах - примерно 276, начинается где-то с 402 страницы)

Активный словарный запас

Использовано уникальных слов48051
Активный словарный запас (АСЗ)45285
Активный не словарный запас (АНСЗ)2766
Удельный АСЗ на 3000 слов текста1718.42123724 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4553.65127207 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста24705.2536574 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 314330: Черная книга коммунизма (Николя Верт)
Максимальный УАСЗ-3000 (1911) наблюдается примерно на 1061 странице
Минимальный УАСЗ-3000 (1478) наблюдается примерно на 334 странице
Рост АСЗ книги № 314330: Черная книга коммунизма (Николя Верт)

Буквы и знаки препинания

Всего букв1760420 букв
Всего знаков препинания50806 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 28013100.36
. 1511454.15
- 20447.32
? 3081.10
! 2931.05
... 00.00
!.. 20.01
?.. 10.00
!!! 10.00
?! 10.00
" 00.00
() 22348.00
: 18836.75
; 9123.27
БукваКол-во (шт.)Частота использования (в %)
А1340167.61
Б280341.59
В871174.95
Г311651.77
Д517292.94
Е-Ё1469978.35
Ж311651.77
З271731.54
И-Й1710819.72
К581933.31
Л774224.40
М529143.01
Н1184526.73
О18602610.57
П494302.81
Р898985.11
С1039595.91
Т1020895.80
У376452.14
Ф38700.22
Х207671.18
Ц124010.70
Ч229681.30
Ш111120.63
Щ62200.35
Ь-Ъ289181.64
Ы365022.07
Э46890.27
Ю120230.68
Я326071.85
Диаграма использования букв книги № 314330: Черная книга коммунизма (Николя Верт)

Части речи

Определенных частей речи (ОЧР)277912 слов
Не определенных частей речи (НОЧР)1201 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.10753638.694
Глаг.1051114.411
Мест.-сущ.105113.782
Предл.3255612.888
Союз169916
Прилаг.3255611.714
Нареч.107763.877
Местоим-прилаг.116864.205
Частица63682.291
Местоим. нареч.21240.764
Числит.24110.868
Числит-прилаг.8460.304
Междомет.290.010
Часть комп.
сложн. слова
2110.076

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.120.7265.7811.0764.8637.3541.4514.9515.877.174.071.981.270.080.30
Глаг.35.5719.056.2937.497.7416.848.146.473.651.151.260.390.010.07
Мест.-сущ.9.1411.871.162.502.882.992.411.013.320.330.130.060.000.00
Предл.77.072.039.461.450.6021.040.9511.720.100.133.220.930.010.15
Союз18.0210.773.966.571.858.294.772.962.620.760.350.110.000.11
Прилаг.90.144.060.823.985.0810.410.850.640.580.300.130.070.000.10
Нареч.4.2013.331.395.172.525.632.731.071.920.230.550.040.000.00
Местоим-прилаг.19.435.392.172.911.186.331.660.991.500.180.190.100.000.01
Частица3.549.250.832.610.591.901.570.921.060.350.260.030.000.00
Местоим. нареч.0.852.050.500.701.080.680.590.170.870.120.020.000.000.00
Числит.5.910.310.100.490.170.750.100.200.060.010.560.030.000.00
Числит-прилаг.1.940.210.070.140.070.440.060.010.040.010.040.000.000.00
Междомет.0.050.000.000.020.000.010.000.000.010.000.000.000.000.00
Часть комп.
сложн. слова
0.340.000.000.000.010.390.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.24.4939.9237.4937.1937.84
Глаг.7.5615.7618.5819.0917.70
Мест.-сущ.7.275.274.163.403.33
Предл.24.429.3311.3112.0712.22
Союз8.043.533.894.165.23
Прилаг.8.329.4110.4811.3711.82
Нареч.6.754.284.444.423.62
Местоим-прилаг.6.845.664.173.983.86
Частица2.393.983.392.492.52
Местоим. нареч.2.041.000.700.620.64
Числит.0.841.080.860.930.85
Числит-прилаг.0.950.700.420.230.27
Междомет.0.040.020.040.000.01
Часть комп.
сложн. слова
0.050.040.060.040.10

Номер слова в предложении
678910
Сущ.37.9038.4238.1338.3338.07
Глаг.16.8915.7015.5414.5614.65
Мест.-сущ.3.493.083.173.613.35
Предл.12.7912.6913.2113.1813.21
Союз5.225.846.256.517.07
Прилаг.11.9812.3111.8212.0112.28
Нареч.3.753.953.873.863.60
Местоим-прилаг.3.913.913.903.963.84
Частица2.202.132.142.012.05
Местоим. нареч.0.680.730.620.630.58
Числит.0.820.941.001.050.95
Числит-прилаг.0.270.200.250.220.30
Междомет.0.020.010.000.000.01
Часть комп.
сложн. слова
0.080.090.100.070.06

Номер слова в предложении
1112131415
Сущ.38.0436.7237.3238.1337.70
Глаг.14.7315.3414.2514.2414.68
Мест.-сущ.3.743.563.803.763.41
Предл.12.9912.6913.5612.7313.56
Союз6.387.006.776.837.51
Прилаг.11.6812.5012.0812.3511.83
Нареч.3.623.753.563.583.60
Местоим-прилаг.4.534.314.344.033.86
Частица2.152.072.192.412.13
Местоим. нареч.0.720.730.700.760.75
Числит.0.991.030.940.830.74
Числит-прилаг.0.340.220.350.290.13
Междомет.0.010.000.010.000.00
Часть комп.
сложн. слова
0.090.070.120.060.09