Лингвистический анализ: Мир книги. С древнейших времен до начала XX века (Евгений Немировский)


- Мир книги. С древнейших времен до начала XX века 4.11 Мб, 480с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Евгений Львович Немировский

Общая статистика

Длина текста863276 знаков
Длина диалогов1612 знаков
Слов в произведении (СВП)116028 слов
Приблизительно страниц480 стр.
Средняя длина слова5.95 знаков
Предложений в произведении (ПВП)11883 предл.
Средняя длина предложения (СДП)69.67 знаков
Доля диалогов в тексте0.19 %
Доля авторского текста99.81 %
СДП диалогов123.08 знаков
СДП авторского текста69.79 знаков
Использование диалогов по тексту книги № 605904: Мир книги. С древнейших времен до начала XX века (Евгений Немировский)
Максимальный фрагмент авторского текста - 400035 знаков (в страницах - примерно 222, начинается где-то с 45 страницы)

Активный словарный запас

Использовано уникальных слов27517
Активный словарный запас (АСЗ)25413
Активный не словарный запас (АНСЗ)2104
Удельный АСЗ на 3000 слов текста1685.18426873 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4515.42361500 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста24972.5779025 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 605904: Мир книги. С древнейших времен до начала XX века (Евгений Немировский)
Максимальный УАСЗ-3000 (1842) наблюдается примерно на 471 странице
Минимальный УАСЗ-3000 (1546) наблюдается примерно на 442 странице
Рост АСЗ книги № 605904: Мир книги. С древнейших времен до начала XX века (Евгений Немировский)

Буквы и знаки препинания

Всего букв689274 букв
Всего знаков препинания27541 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 1024088.25
. 12137104.60
- 360331.05
? 1471.27
! 1040.90
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 10.01
" 140.12
() 6605.69
: 3853.32
; 2502.15
БукваКол-во (шт.)Частота использования (в %)
А557198.08
Б107381.56
В322594.68
Г153732.23
Д178672.59
Е-Ё571538.29
Ж153732.23
З112091.63
И-Й6988310.14
К253373.68
Л321214.66
М209083.03
Н469146.81
О6941810.07
П195582.84
Р363765.28
С365145.30
Т391825.68
У156852.28
Ф39720.58
Х69421.01
Ц37100.54
Ч93701.36
Ш47000.68
Щ20770.30
Ь-Ъ103091.50
Ы133171.93
Э22430.33
Ю44690.65
Я106271.54
Диаграма использования букв книги № 605904: Мир книги. С древнейших времен до начала XX века (Евгений Немировский)

Части речи

Определенных частей речи (ОЧР)115203 слов
Не определенных частей речи (НОЧР)825 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4609340.010
Глаг.532514.367
Мест.-сущ.53254.622
Предл.1235512.148
Союз74866
Прилаг.1235510.725
Нареч.44703.880
Местоим-прилаг.43713.794
Частица22451.949
Местоим. нареч.8800.764
Числит.5950.516
Числит-прилаг.6790.589
Междомет.1060.092
Часть комп.
сложн. слова
520.045

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.143.2168.8313.7858.6736.6035.6214.6514.366.103.831.272.270.740.19
Глаг.41.4713.489.6933.039.6518.126.884.902.861.381.130.960.050.06
Мест.-сущ.10.3615.091.324.313.553.753.510.952.510.380.200.290.020.00
Предл.68.372.1211.592.341.5919.920.8711.480.120.101.361.530.020.08
Союз21.7010.503.626.762.707.675.752.472.480.660.290.320.040.02
Прилаг.81.002.981.333.785.4010.031.070.680.410.300.080.090.030.08
Нареч.4.6214.361.484.772.674.682.461.072.030.290.300.100.000.00
Местоим-прилаг.17.476.021.664.110.853.561.610.781.280.230.150.220.010.00
Частица3.837.420.742.020.661.151.270.880.950.320.190.050.000.00
Местоим. нареч.1.042.070.820.491.090.520.590.160.690.110.030.020.000.00
Числит.3.450.170.040.340.100.690.080.090.020.000.160.030.010.00
Числит-прилаг.3.100.370.160.720.091.220.040.100.030.000.030.020.000.02
Междомет.0.330.250.020.140.030.040.030.020.000.030.000.010.010.00
Часть комп.
сложн. слова
0.160.000.000.010.000.270.000.000.000.010.000.000.000.01

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.35.2935.5336.1137.6238.48
Глаг.10.2519.3519.3117.3917.81
Мест.-сущ.7.048.345.455.203.96
Предл.18.049.3311.6011.8011.71
Союз7.784.105.405.505.70
Прилаг.7.118.689.6111.2011.65
Нареч.5.254.694.743.663.50
Местоим-прилаг.3.744.573.483.633.22
Частица1.212.902.332.322.29
Местоим. нареч.2.460.790.610.500.35
Числит.0.430.570.550.690.79
Числит-прилаг.1.141.060.730.460.49
Междомет.0.210.030.040.010.02
Часть комп.
сложн. слова
0.040.060.030.030.03

Номер слова в предложении
678910
Сущ.37.3038.0639.2238.2438.29
Глаг.16.3414.5813.9314.4913.71
Мест.-сущ.3.393.823.563.943.50
Предл.12.5912.7611.9212.1712.42
Союз6.076.466.596.937.09
Прилаг.12.5012.5912.9813.5213.54
Нареч.3.883.444.153.013.26
Местоим-прилаг.3.754.443.823.994.50
Частица2.412.212.121.922.08
Местоим. нареч.0.620.500.610.620.67
Числит.0.540.560.550.640.41
Числит-прилаг.0.530.470.460.530.41
Междомет.0.010.010.000.000.04
Часть комп.
сложн. слова
0.060.080.080.020.08

Номер слова в предложении
1112131415
Сущ.37.5239.4538.7439.1338.22
Глаг.13.1313.4312.9512.2712.44
Мест.-сущ.4.093.514.033.954.01
Предл.11.9811.9712.9511.3913.14
Союз7.016.137.427.017.40
Прилаг.14.4614.0013.3514.6313.97
Нареч.3.463.513.183.672.81
Местоим-прилаг.4.524.133.874.054.05
Частица2.182.101.762.292.23
Местоим. нареч.0.450.680.510.490.62
Числит.0.540.700.580.810.54
Числит-прилаг.0.560.290.540.250.50
Междомет.0.000.050.120.040.04
Часть комп.
сложн. слова
0.090.050.000.040.04