Лингвистический анализ: Похождения бравого солдата Швейка (Ярослав Гашек)


- Похождения бравого солдата Швейка (пер. Петр Григорьевич Богатырев) (и.с. Иностранная литература. Большие книги) 6.09 Мб, 756с. скачать: (fb2) (исправленную)  читать: (полностью)  - Ярослав Гашек

Общая статистика

Длина текста1360637 знаков
Длина диалогов708353 знаков
Слов в произведении (СВП)205624 слов
Приблизительно страниц756 стр.
Средняя длина слова5.28 знаков
Предложений в произведении (ПВП)15379 предл.
Средняя длина предложения (СДП)85.66 знаков
Доля диалогов в тексте52.06 %
Доля авторского текста47.94 %
СДП диалогов97.10 знаков
СДП авторского текста119.76 знаков
Использование диалогов по тексту книги № 391871: Похождения бравого солдата Швейка (Ярослав Гашек)
Максимальный фрагмент авторского текста - 8422 знаков (в страницах - примерно 5, начинается где-то с 335 страницы)

Активный словарный запас

Использовано уникальных слов35868
Активный словарный запас (АСЗ)33404
Активный не словарный запас (АНСЗ)2464
Удельный АСЗ на 3000 слов текста1505.66306292 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4001.44277902 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста22327.7155838 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 391871: Похождения бравого солдата Швейка (Ярослав Гашек)
Максимальный УАСЗ-3000 (1765) наблюдается примерно на 746 странице
Минимальный УАСЗ-3000 (1278) наблюдается примерно на 397 странице
Рост АСЗ книги № 391871: Похождения бравого солдата Швейка (Ярослав Гашек)

Буквы и знаки препинания

Всего букв1075155 букв
Всего знаков препинания45605 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 24563119.46
. 1277162.11
- 248512.09
? 11605.64
! 20109.78
... 00.00
!.. 390.19
?.. 330.16
!!! 00.00
?! 290.14
" 00.00
() 4132.01
: 18819.15
; 2211.07
БукваКол-во (шт.)Частота использования (в %)
А881378.20
Б182281.70
В495984.61
Г198241.84
Д352223.28
Е-Ё895528.33
Ж198241.84
З174391.62
И-Й855247.95
К415083.86
Л521694.85
М312152.90
Н663446.17
О11913711.08
П332943.10
Р497334.63
С548225.10
Т659116.13
У306762.85
Ф29750.28
Х85730.80
Ц49090.46
Ч156551.46
Ш119201.11
Щ32480.30
Ь-Ъ201091.87
Ы193351.80
Э32730.30
Ю60750.57
Я210251.96
Диаграма использования букв книги № 391871: Похождения бравого солдата Швейка (Ярослав Гашек)

Части речи

Определенных частей речи (ОЧР)203170 слов
Не определенных частей речи (НОЧР)2454 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.5656727.842
Глаг.1972018.312
Мест.-сущ.197209.706
Предл.1366811.587
Союз171068
Прилаг.136686.727
Нареч.103525.095
Местоим-прилаг.101574.999
Частица81173.995
Местоим. нареч.39481.943
Числит.17970.884
Числит-прилаг.7470.368
Междомет.2290.113
Часть комп.
сложн. слова
170.008

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.61.2955.8719.7141.2638.8615.4814.4712.809.226.262.010.770.390.02
Глаг.39.5921.8120.6039.0719.5011.1310.038.587.073.791.430.270.230.00
Мест.-сущ.13.7330.516.949.836.455.088.733.768.332.930.530.120.120.00
Предл.60.221.5819.040.791.0215.240.6313.710.040.062.291.180.020.05
Союз13.9718.4314.459.403.673.846.144.855.802.970.480.140.050.00
Прилаг.47.954.621.501.993.774.570.830.720.680.380.220.020.020.00
Нареч.4.7719.494.135.344.183.263.841.452.970.870.500.100.050.00
Местоим-прилаг.23.626.503.902.581.385.601.891.501.850.770.300.100.020.00
Частица4.0718.833.743.331.921.342.311.701.650.860.150.040.010.00
Местоим. нареч.1.774.532.521.802.970.631.850.682.120.450.080.020.000.00
Числит.5.020.530.180.250.280.490.180.160.080.060.820.800.000.00
Числит-прилаг.2.160.230.150.190.130.540.040.040.060.010.020.100.000.00
Междомет.0.250.180.190.050.060.020.030.030.070.030.010.010.190.00
Часть комп.
сложн. слова
0.020.000.000.000.000.060.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.17.5322.6924.9626.9828.30
Глаг.14.6021.1523.1420.6419.99
Мест.-сущ.14.9816.0711.8410.058.38
Предл.12.557.9110.6611.6911.68
Союз13.204.605.417.218.31
Прилаг.3.395.325.706.627.14
Нареч.7.867.356.235.534.73
Местоим-прилаг.4.715.784.314.544.63
Частица5.315.994.593.873.82
Местоим. нареч.4.541.961.971.681.61
Числит.0.610.650.770.750.94
Числит-прилаг.0.230.430.300.330.35
Междомет.0.490.110.110.080.10
Часть комп.
сложн. слова
0.000.000.000.030.01

Номер слова в предложении
678910
Сущ.27.8327.9526.9427.5127.05
Глаг.18.4817.7618.2817.3618.09
Мест.-сущ.8.658.698.808.588.87
Предл.12.6512.4112.3312.8012.34
Союз9.069.649.639.589.71
Прилаг.6.886.997.287.227.28
Нареч.4.634.504.644.454.44
Местоим-прилаг.4.934.904.785.485.59
Частица3.803.863.923.843.60
Местоим. нареч.1.831.801.891.771.71
Числит.0.850.970.980.990.91
Числит-прилаг.0.330.400.430.330.36
Междомет.0.070.110.080.070.03
Часть комп.
сложн. слова
0.020.010.020.000.01

Номер слова в предложении
1112131415
Сущ.26.6027.2926.3427.7426.97
Глаг.17.9117.7017.5016.3417.61
Мест.-сущ.8.828.987.948.899.10
Предл.12.7812.7813.3312.6113.14
Союз9.788.929.709.079.04
Прилаг.6.987.597.638.127.41
Нареч.4.314.434.504.354.41
Местоим-прилаг.5.295.395.545.905.34
Частица4.193.564.163.904.04
Местоим. нареч.2.031.831.921.681.38
Числит.0.931.061.070.971.10
Числит-прилаг.0.330.360.280.400.35
Междомет.0.040.120.100.050.10
Часть комп.
сложн. слова
0.010.000.000.000.00