Лингвистический анализ: Русская колонизация (Матвей Любавский)


- Русская колонизация (а.с. Собирая империю) 1.34 Мб, 293с. скачать: (fb2) (исправленную)  читать: (полностью)  - Матвей Кузьмич Любавский

Общая статистика

Длина текста526506 знаков
Длина диалогов325 знаков
Слов в произведении (СВП)74522 слов
Приблизительно страниц293 стр.
Средняя длина слова5.76 знаков
Предложений в произведении (ПВП)5327 предл.
Средняя длина предложения (СДП)95.85 знаков
Доля диалогов в тексте0.06 %
Доля авторского текста99.94 %
СДП диалогов64.20 знаков
СДП авторского текста90.44 знаков
Использование диалогов по тексту книги № 309054: Русская колонизация (Матвей Любавский)
Максимальный фрагмент авторского текста - 137776 знаков (в страницах - примерно 77, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов16242
Активный словарный запас (АСЗ)14886
Активный не словарный запас (АНСЗ)1356
Удельный АСЗ на 3000 слов текста1418.92123724 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3648.37127207 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 309054: Русская колонизация (Матвей Любавский)
Максимальный УАСЗ-3000 (1550) наблюдается примерно на 141 странице
Минимальный УАСЗ-3000 (1202) наблюдается примерно на 287 странице
Рост АСЗ книги № 309054: Русская колонизация (Матвей Любавский)

Буквы и знаки препинания

Всего букв426557 букв
Всего знаков препинания14654 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 7574101.63
. 581578.03
- 5487.35
? 340.46
! 10.01
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 00.00
" 00.00
() 2232.99
: 2543.41
; 2052.75
БукваКол-во (шт.)Частота использования (в %)
А302957.10
Б65981.55
В215025.04
Г75091.76
Д115552.71
Е-Ё381868.95
Ж75091.76
З72001.69
И-Й407349.55
К151573.55
Л200894.71
М128233.01
Н271376.36
О4680210.97
П116082.72
Р215215.05
С285976.70
Т220145.16
У90162.11
Ф3750.09
Х52021.22
Ц20620.48
Ч49131.15
Ш24970.59
Щ12340.29
Ь-Ъ74221.74
Ы82521.93
Э13570.32
Ю26060.61
Я87672.06
Диаграма использования букв книги № 309054: Русская колонизация (Матвей Любавский)

Части речи

Определенных частей речи (ОЧР)73628 слов
Не определенных частей речи (НОЧР)894 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.2769637.616
Глаг.277411.720
Мест.-сущ.27743.768
Предл.914814.624
Союз59348
Прилаг.914812.425
Нареч.29484.004
Местоим-прилаг.31524.281
Частица12271.666
Местоим. нареч.8231.118
Числит.2640.359
Числит-прилаг.1560.212
Междомет.80.011
Часть комп.
сложн. слова
1020.139

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.96.8053.6110.5778.3049.8345.1214.1016.644.365.130.790.540.050.33
Глаг.26.4212.475.1631.038.9213.878.614.562.652.590.800.080.000.03
Мест.-сущ.12.839.190.623.612.803.032.120.862.160.240.150.010.000.04
Предл.81.872.7613.013.161.2626.821.0913.070.190.260.841.210.000.68
Союз26.1010.464.1611.252.6511.696.373.572.361.390.260.100.040.20
Прилаг.94.493.630.734.757.5810.291.140.620.390.430.110.010.000.05
Нареч.4.8510.741.188.113.785.273.151.051.260.330.240.070.000.01
Местоим-прилаг.22.996.101.221.891.054.661.481.251.670.290.110.080.000.03
Частица3.425.220.382.440.721.250.880.980.980.260.120.000.010.00
Местоим. нареч.1.552.800.611.371.900.880.910.190.620.260.050.010.000.01
Числит.2.500.160.030.150.080.370.160.030.010.000.100.000.000.00
Числит-прилаг.1.620.070.000.160.010.220.030.000.000.000.010.000.000.00
Междомет.0.110.000.000.000.000.000.000.000.000.000.000.000.000.00
Часть комп.
сложн. слова
0.600.000.000.000.010.770.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.29.9235.5736.7435.7434.99
Глаг.6.7413.6914.5015.7715.77
Мест.-сущ.4.956.294.834.373.17
Предл.23.3011.9713.1314.8316.23
Союз7.385.616.155.666.08
Прилаг.9.5811.9212.1911.8112.19
Нареч.5.674.734.464.774.12
Местоим-прилаг.7.195.524.433.863.81
Частица1.012.561.891.531.60
Местоим. нареч.3.530.931.060.910.98
Числит.0.360.320.240.350.46
Числит-прилаг.0.340.770.310.270.23
Междомет.0.000.000.000.000.00
Часть комп.
сложн. слова
0.040.140.070.120.36

Номер слова в предложении
678910
Сущ.35.7138.0336.4136.1234.75
Глаг.13.9513.1412.6913.0812.48
Мест.-сущ.3.272.733.453.373.57
Предл.14.1713.4715.1615.0314.77
Союз7.388.057.888.549.12
Прилаг.13.8714.0613.1412.7014.23
Нареч.4.273.633.984.383.53
Местоим-прилаг.4.483.713.833.624.34
Частица1.481.721.961.481.58
Местоим. нареч.0.800.900.830.881.18
Числит.0.400.280.420.220.24
Числит-прилаг.0.110.170.150.280.17
Междомет.0.030.000.000.000.00
Часть комп.
сложн. слова
0.080.110.090.280.07

Номер слова в предложении
1112131415
Сущ.36.1035.2036.4033.3636.35
Глаг.12.4511.2711.9611.3812.18
Мест.-сущ.3.343.283.824.604.18
Предл.14.5514.4313.1416.6614.72
Союз8.1610.6910.509.2410.24
Прилаг.13.1713.4713.0612.7411.49
Нареч.3.663.904.164.283.03
Местоим-прилаг.4.504.134.114.194.13
Частица1.921.541.391.731.64
Местоим. нареч.1.381.120.881.091.04
Числит.0.360.620.340.500.50
Числит-прилаг.0.180.080.080.050.15
Междомет.0.000.040.000.000.05
Часть комп.
сложн. слова
0.220.230.170.180.30