Лингвистический анализ: Русско-еврейский Берлин (1920—1941) (Олег Будницкий)


- Русско-еврейский Берлин (1920—1941) (и.с. historia rossica) 1.87 Мб, 517с. скачать: (fb2) (исправленную)  читать: (полностью)  - Олег Витальевич Будницкий - Александра Полян

Общая статистика

Длина текста929926 знаков
Длина диалогов393 знаков
Слов в произведении (СВП)122867 слов
Приблизительно страниц517 стр.
Средняя длина слова5.90 знаков
Предложений в произведении (ПВП)14168 предл.
Средняя длина предложения (СДП)62.64 знаков
Доля диалогов в тексте0.04 %
Доля авторского текста99.96 %
СДП диалогов393.00 знаков
СДП авторского текста54.01 знаков
Использование диалогов по тексту книги № 318218: Русско-еврейский Берлин (1920—1941) (Олег Будницкий)
Максимальный фрагмент авторского текста - 388087 знаков (в страницах - примерно 216, начинается где-то с 41 страницы)

Активный словарный запас

Использовано уникальных слов24451
Активный словарный запас (АСЗ)21710
Активный не словарный запас (АНСЗ)2741
Удельный АСЗ на 3000 слов текста1495.27146852 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3942.5295358 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста21443.6426825 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 318218: Русско-еврейский Берлин (1920—1941) (Олег Будницкий)
Максимальный УАСЗ-3000 (1708) наблюдается примерно на 357 странице
Минимальный УАСЗ-3000 (994) наблюдается примерно на 391 странице
Рост АСЗ книги № 318218: Русско-еврейский Берлин (1920—1941) (Олег Будницкий)

Буквы и знаки препинания

Всего букв683460 букв
Всего знаков препинания34954 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 1161094.49
. 17795144.83
- 184615.02
? 880.72
! 630.51
... 00.00
!.. 10.01
?.. 30.02
!!! 00.00
?! 10.01
" 00.00
() 136111.08
: 171713.97
; 4693.82
БукваКол-во (шт.)Частота использования (в %)
А500377.32
Б118751.74
В347185.08
Г139252.04
Д201752.95
Е-Ё631619.24
Ж139252.04
З107681.58
И-Й6909910.11
К232913.41
Л286814.20
М216243.16
Н440186.44
О6884610.07
П168192.46
Р382015.59
С411556.02
Т360225.27
У157852.31
Ф21960.32
Х68791.01
Ц50070.73
Ч80681.18
Ш41190.60
Щ25840.38
Ь-Ъ107641.57
Ы114651.68
Э22310.33
Ю44940.66
Я116891.71
Диаграма использования букв книги № 318218: Русско-еврейский Берлин (1920—1941) (Олег Будницкий)

Части речи

Определенных частей речи (ОЧР)114298 слов
Не определенных частей речи (НОЧР)8569 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4739341.464
Глаг.427311.141
Мест.-сущ.42733.738
Предл.1392313.027
Союз83307
Прилаг.1392312.181
Нареч.41283.612
Местоим-прилаг.36973.235
Частица29582.588
Местоим. нареч.9180.803
Числит.3860.338
Числит-прилаг.2930.256
Междомет.1370.120
Часть комп.
сложн. слова
2380.208

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.147.4051.6711.1674.5843.0945.6613.6911.098.244.030.810.900.981.32
Глаг.28.8911.755.6326.727.9713.247.004.443.840.870.680.230.030.11
Мест.-сущ.10.8910.540.822.562.883.312.580.712.640.310.080.040.010.01
Предл.79.691.669.812.241.3421.961.089.380.260.450.991.200.010.20
Союз25.007.844.388.315.569.684.283.103.500.680.220.080.070.19
Прилаг.91.933.171.014.345.9212.561.060.540.570.450.090.020.020.15
Нареч.4.1510.181.455.142.665.912.800.992.190.360.230.030.000.03
Местоим-прилаг.15.194.351.602.610.863.951.221.011.090.250.120.030.010.04
Частица5.828.750.872.841.152.051.770.781.180.510.100.010.060.00
Местоим. нареч.0.671.300.430.671.280.520.520.192.310.110.000.010.000.00
Числит.2.350.100.070.100.090.450.060.060.030.000.040.010.000.01
Числит-прилаг.1.470.090.150.130.030.580.030.040.020.000.020.000.000.01
Междомет.1.020.020.010.020.030.060.020.010.000.000.000.000.010.00
Часть комп.
сложн. слова
0.170.000.000.000.021.890.000.000.010.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.49.3239.0940.0041.1939.04
Глаг.4.3012.1912.8313.9413.54
Мест.-сущ.4.984.623.763.813.43
Предл.15.8611.3312.7812.4412.97
Союз5.179.717.355.437.16
Прилаг.8.109.9411.5513.0913.46
Нареч.5.553.304.003.353.62
Местоим-прилаг.2.693.353.563.432.64
Частица1.224.762.742.132.47
Местоим. нареч.2.210.400.600.460.66
Числит.0.220.410.310.270.48
Числит-прилаг.0.260.560.290.210.19
Междомет.0.030.050.030.020.02
Часть комп.
сложн. слова
0.080.290.200.240.31

Номер слова в предложении
678910
Сущ.39.7341.4541.2438.8738.89
Глаг.13.4211.5811.9811.2413.22
Мест.-сущ.2.823.233.543.493.61
Предл.12.5213.4712.7613.8512.81
Союз7.356.806.647.286.57
Прилаг.13.4812.6013.1313.0612.74
Нареч.3.073.703.394.103.47
Местоим-прилаг.3.413.103.023.083.32
Частица2.432.472.262.523.71
Местоим. нареч.0.660.530.981.790.73
Числит.0.570.410.360.320.41
Числит-прилаг.0.330.270.290.200.24
Междомет.0.040.040.020.020.02
Часть комп.
сложн. слова
0.180.330.380.180.24

Номер слова в предложении
1112131415
Сущ.37.7437.8236.8139.5039.39
Глаг.12.8811.9911.6911.5412.45
Мест.-сущ.3.424.033.794.604.22
Предл.13.4613.9613.6113.6312.67
Союз7.197.887.546.857.55
Прилаг.14.0412.7314.8413.4613.20
Нареч.3.563.913.943.183.51
Местоим-прилаг.3.873.543.483.513.15
Частица2.552.432.962.182.50
Местоим. нареч.0.790.860.520.730.54
Числит.0.210.310.370.300.29
Числит-прилаг.0.130.340.340.230.29
Междомет.0.000.030.000.000.00
Часть комп.
сложн. слова
0.160.170.120.300.25