Лингвистический анализ: Русско-Эсперантский Словарь (Rusa-Esperanta Vortaro) (Евгений Бокарев)


- Русско-Эсперантский Словарь (Rusa-Esperanta Vortaro) [Около 24000 слов] 1.58 Мб, 621с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Евгений Бокарев

Общая статистика

Длина текста1117560 знаков
Длина диалогов141 знаков
Слов в произведении (СВП)137865 слов
Приблизительно страниц621 стр.
Средняя длина слова5.66 знаков
Предложений в произведении (ПВП)25284 предл.
Средняя длина предложения (СДП)41.20 знаков
Доля диалогов в тексте0.01 %
Доля авторского текста99.99 %
СДП диалогов70.00 знаков
СДП авторского текста34.37 знаков
Использование диалогов по тексту книги № 388173: Русско-Эсперантский Словарь (Rusa-Esperanta Vortaro) (Евгений Бокарев)
Максимальный фрагмент авторского текста - 4950 знаков (в страницах - примерно 3, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов51803
Активный словарный запас (АСЗ)9230
Активный не словарный запас (АНСЗ)42573
Удельный АСЗ на 3000 слов текста1936.11123834 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста5734.80401723 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста40370.3679025 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 388173: Русско-Эсперантский Словарь (Rusa-Esperanta Vortaro) (Евгений Бокарев)
Максимальный УАСЗ-3000 (2217) наблюдается примерно на 9 странице
Минимальный УАСЗ-3000 (1634) наблюдается примерно на 324 странице
Рост АСЗ книги № 388173: Русско-Эсперантский Словарь (Rusa-Esperanta Vortaro) (Евгений Бокарев)

Буквы и знаки препинания

Всего букв391031 букв
Всего знаков препинания112431 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 15036109.06
. 31083225.46
- 35424256.95
? 1901.38
! 2962.15
... 1731.25
!.. 00.00
?.. 00.00
!!! 00.00
?! 00.00
" 1210.88
() 1084078.63
: 9667.01
; 18302132.75
БукваКол-во (шт.)Частота использования (в %)
А290067.42
Б53411.37
В154023.94
Г56371.44
Д90102.30
Е-Ё282557.23
Ж56371.44
З76281.95
И-Й331328.47
К112372.87
Л132213.38
М375869.61
Н226125.78
О318468.14
П115392.95
Р191664.90
С222855.70
Т287147.34
У82682.11
Ф8670.22
Х22400.57
Ц16640.43
Ч49051.25
Ш19930.51
Щ13930.36
Ь-Ъ158444.05
Ы84082.15
Э6250.16
Ю11230.29
Я92562.37
Диаграма использования букв книги № 388173: Русско-Эсперантский Словарь (Rusa-Esperanta Vortaro) (Евгений Бокарев)

Части речи

Определенных частей речи (ОЧР)61886 слов
Не определенных частей речи (НОЧР)75979 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.3387654.739
Глаг.103612.282
Мест.-сущ.10361.674
Предл.93617.722
Союз20633
Прилаг.936115.126
Нареч.15802.553
Местоим-прилаг.5370.868
Частица6601.066
Местоим. нареч.1110.179
Числит.570.092
Числит-прилаг.1400.226
Междомет.710.115
Часть комп.
сложн. слова
140.023

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.306.0659.466.0942.0621.2588.4512.303.155.540.840.261.340.440.13
Глаг.55.3927.131.4714.142.3916.303.700.760.950.230.080.160.080.03
Мест.-сущ.9.231.970.661.070.891.200.420.230.940.080.020.030.020.00
Предл.51.762.465.122.733.735.401.782.760.390.020.440.160.450.03
Союз19.922.550.812.551.054.060.840.290.860.260.030.060.030.02
Прилаг.79.7922.951.0810.342.1029.313.700.650.650.150.000.440.100.02
Нареч.12.013.680.402.280.783.701.870.210.450.060.050.030.000.00
Местоим-прилаг.4.860.630.340.690.360.790.230.480.260.020.020.000.000.00
Частица4.831.650.571.070.321.110.390.130.470.080.000.020.030.00
Местоим. нареч.0.690.160.180.110.270.060.080.020.130.060.020.000.000.00
Числит.0.630.030.000.050.030.130.020.000.020.000.020.000.000.00
Числит-прилаг.1.420.080.000.060.100.400.180.000.000.000.000.020.000.00
Междомет.0.690.060.020.050.060.210.030.000.020.000.000.000.000.00
Часть комп.
сложн. слова
0.080.000.000.020.000.130.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.57.7059.8156.6652.6150.62
Глаг.14.709.6011.0710.719.39
Мест.-сущ.0.342.192.711.892.10
Предл.4.487.387.378.2311.59
Союз0.425.863.633.805.38
Прилаг.17.4510.9414.6218.2315.38
Нареч.3.551.181.362.062.43
Местоим-прилаг.0.481.280.990.760.71
Частица0.271.470.941.101.68
Местоим. нареч.0.110.150.340.250.16
Числит.0.040.010.040.080.06
Числит-прилаг.0.390.060.230.130.23
Междомет.0.040.030.020.150.26
Часть комп.
сложн. слова
0.030.050.020.000.00

Номер слова в предложении
678910
Сущ.52.8151.5751.3851.4150.32
Глаг.9.209.509.409.998.99
Мест.-сущ.2.502.631.962.243.00
Предл.11.6211.2513.0312.0213.08
Союз4.955.075.655.726.18
Прилаг.13.2613.6512.5712.3111.53
Нареч.2.982.812.602.752.45
Местоим-прилаг.0.631.010.870.801.18
Частица1.271.892.081.591.82
Местоим. нареч.0.300.140.170.220.36
Числит.0.110.180.000.290.36
Числит-прилаг.0.190.140.060.140.27
Междомет.0.190.090.230.510.45
Часть комп.
сложн. слова
0.000.050.000.000.00

Номер слова в предложении
1112131415
Сущ.49.8452.0648.6348.1843.51
Глаг.10.1210.319.1211.829.48
Мест.-сущ.1.412.962.893.272.89
Предл.11.5311.6010.9411.2712.99
Союз5.885.417.296.557.22
Прилаг.14.1511.8613.5312.5516.29
Нареч.2.391.932.132.362.27
Местоим-прилаг.1.201.291.981.271.24
Частица2.941.802.581.273.09
Местоим. нареч.0.220.000.150.550.21
Числит.0.220.390.460.360.21
Числит-прилаг.0.110.000.150.180.21
Междомет.0.000.260.150.360.41
Часть комп.
сложн. слова
0.000.130.000.000.00