Лингвистический анализ: Избранное. Молодая Россия (Михаил Гершензон)


- Избранное. Молодая Россия (а.с. Российские Пропилеи) 3.31 Мб, 873с. скачать: (fb2) (исправленную)  читать: (полностью)  - Михаил Осипович Гершензон

Общая статистика

Длина текста1569840 знаков
Длина диалогов3058 знаков
Слов в произведении (СВП)228827 слов
Приблизительно страниц873 стр.
Средняя длина слова5.39 знаков
Предложений в произведении (ПВП)16058 предл.
Средняя длина предложения (СДП)94.86 знаков
Доля диалогов в тексте0.19 %
Доля авторского текста99.81 %
СДП диалогов100.97 знаков
СДП авторского текста85.16 знаков
Использование диалогов по тексту книги № 335236: Избранное. Молодая Россия (Михаил Гершензон)
Максимальный фрагмент авторского текста - 682961 знаков (в страницах - примерно 379, начинается где-то с 221 страницы)

Активный словарный запас

Использовано уникальных слов42099
Активный словарный запас (АСЗ)39106
Активный не словарный запас (АНСЗ)2993
Удельный АСЗ на 3000 слов текста1551.67418847 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4152.14393267 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста24102.3369377 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 335236: Избранное. Молодая Россия (Михаил Гершензон)
Максимальный УАСЗ-3000 (1741) наблюдается примерно на 537 странице
Минимальный УАСЗ-3000 (1060) наблюдается примерно на 724 странице
Рост АСЗ книги № 335236: Избранное. Молодая Россия (Михаил Гершензон)

Буквы и знаки препинания

Всего букв1220341 букв
Всего знаков препинания55272 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 26282114.86
. 1889682.58
- 20068.77
? 5622.46
! 13125.73
... 00.00
!.. 250.11
?.. 120.05
!!! 30.01
?! 10.00
" 00.00
() 17067.46
: 21889.56
; 22799.96
БукваКол-во (шт.)Частота использования (в %)
А871417.14
Б211931.74
В603564.95
Г248242.03
Д365122.99
Е-Ё1136869.32
Ж248242.03
З192501.58
И-Й1065948.73
К386643.17
Л504164.13
М390503.20
Н834276.84
О13297410.90
П325132.66
Р571224.68
С708815.81
Т723355.93
У320892.63
Ф29840.24
Х106620.87
Ц55540.46
Ч184831.51
Ш88340.72
Щ45630.37
Ь-Ъ213401.75
Ы206651.69
Э35450.29
Ю87790.72
Я236601.94
Диаграма использования букв книги № 335236: Избранное. Молодая Россия (Михаил Гершензон)

Части речи

Определенных частей речи (ОЧР)225300 слов
Не определенных частей речи (НОЧР)3527 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.7386232.784
Глаг.1912313.906
Мест.-сущ.191238.488
Предл.2133512.106
Союз183008
Прилаг.213359.470
Нареч.103564.597
Местоим-прилаг.114975.103
Частица71793.186
Местоим. нареч.31221.386
Числит.11050.490
Числит-прилаг.5850.260
Междомет.1610.071
Часть комп.
сложн. слова
690.031

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.93.2846.5321.9153.7041.6227.3112.8215.797.345.281.170.710.240.13
Глаг.27.7513.3317.8232.4811.8211.048.018.025.402.290.670.280.130.03
Мест.-сущ.17.0324.734.067.226.137.367.283.126.001.510.260.170.010.00
Предл.64.681.8517.871.351.2517.100.7513.410.110.331.191.030.040.09
Союз20.2312.519.698.794.018.076.674.234.531.840.410.200.030.02
Прилаг.64.894.572.614.046.907.231.301.460.860.530.190.040.040.03
Нареч.4.1914.893.135.883.915.173.951.292.570.620.300.020.030.00
Местоим-прилаг.24.355.003.922.761.697.231.671.681.640.640.370.080.000.00
Частица4.6712.672.323.341.162.221.951.451.370.480.190.040.000.00
Местоим. нареч.1.432.571.281.072.411.101.400.381.880.270.040.020.000.00
Числит.3.300.190.130.230.160.500.100.110.070.010.100.010.000.00
Числит-прилаг.1.750.170.080.140.080.160.050.050.080.030.000.000.000.00
Междомет.0.160.060.060.050.070.030.010.040.030.030.000.000.170.00
Часть комп.
сложн. слова
0.120.000.000.000.000.180.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.28.7333.2935.3033.7533.37
Глаг.9.2616.1016.1415.5715.11
Мест.-сущ.12.698.808.668.228.03
Предл.16.4010.6811.4112.2212.44
Союз10.405.025.666.247.18
Прилаг.5.768.058.659.499.53
Нареч.5.585.274.634.604.79
Местоим-прилаг.4.185.124.184.824.61
Частица2.805.263.372.952.93
Местоим. нареч.2.981.191.031.290.98
Числит.0.510.620.510.510.65
Числит-прилаг.0.390.360.300.260.29
Междомет.0.290.180.120.030.05
Часть комп.
сложн. слова
0.040.080.040.050.03

Номер слова в предложении
678910
Сущ.33.1333.0433.1932.1832.10
Глаг.14.6314.2114.1513.3914.11
Мест.-сущ.7.758.277.998.287.49
Предл.12.4712.3212.1712.5113.03
Союз7.497.798.478.317.81
Прилаг.10.1410.359.5510.3110.61
Нареч.4.384.214.144.214.55
Местоим-прилаг.4.875.075.195.395.03
Частица3.202.712.853.173.20
Местоим. нареч.1.121.151.401.301.22
Числит.0.580.520.590.590.47
Числит-прилаг.0.190.230.240.270.33
Междомет.0.040.090.030.040.03
Часть комп.
сложн. слова
0.030.030.030.060.03

Номер слова в предложении
1112131415
Сущ.32.1131.0230.8830.8030.83
Глаг.13.5413.9414.2214.1613.84
Мест.-сущ.7.998.168.487.698.71
Предл.12.4812.6212.1012.3412.56
Союз8.948.758.739.039.00
Прилаг.10.279.809.8810.509.90
Нареч.4.314.664.704.584.69
Местоим-прилаг.4.945.595.445.265.00
Частица3.103.403.373.573.12
Местоим. нареч.1.431.361.361.451.62
Числит.0.560.400.470.390.49
Числит-прилаг.0.240.210.250.140.20
Междомет.0.060.060.090.080.04
Часть комп.
сложн. слова
0.030.030.030.020.00