Лингвистический анализ: Лилия долины (Оноре де Бальзак)


- Лилия долины (пер. Елизавета Михайловна Шишмарева, ...) (а.с. Человеческая комедия — Этюды о нравах (Сцены провинциальной жизни)) 1.37 Мб, 327с. скачать: (fb2) (исправленную)  читать: (полностью)  - Оноре де Бальзак

Общая статистика

Длина текста588337 знаков
Длина диалогов137781 знаков
Слов в произведении (СВП)89985 слов
Приблизительно страниц327 стр.
Средняя длина слова5.27 знаков
Предложений в произведении (ПВП)4467 предл.
Средняя длина предложения (СДП)128.89 знаков
Доля диалогов в тексте23.42 %
Доля авторского текста76.58 %
СДП диалогов120.93 знаков
СДП авторского текста164.91 знаков
Использование диалогов по тексту книги № 387814: Лилия долины (Оноре де Бальзак)
Максимальный фрагмент авторского текста - 38488 знаков (в страницах - примерно 21, начинается где-то с 145 страницы)

Активный словарный запас

Использовано уникальных слов20830
Активный словарный запас (АСЗ)20542
Активный не словарный запас (АНСЗ)288
Удельный АСЗ на 3000 слов текста1595.20112815 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4209.0072794 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 387814: Лилия долины (Оноре де Бальзак)
Максимальный УАСЗ-3000 (1815) наблюдается примерно на 105 странице
Минимальный УАСЗ-3000 (1394) наблюдается примерно на 301 странице
Рост АСЗ книги № 387814: Лилия долины (Оноре де Бальзак)

Буквы и знаки препинания

Всего букв474262 букв
Всего знаков препинания19080 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 12251136.14
. 384342.71
- 5466.07
? 4494.99
! 6106.78
... 00.00
!.. 130.14
?.. 40.04
!!! 00.00
?! 70.08
" 00.00
() 500.56
: 3994.43
; 90810.09
БукваКол-во (шт.)Частота использования (в %)
А378717.99
Б86941.83
В222634.69
Г87001.83
Д152563.22
Е-Ё430119.07
Ж87001.83
З79851.68
И-Й371277.83
К144433.05
Л222464.69
М161243.40
Н311066.56
О5012210.57
П117242.47
Р208224.39
С254395.36
Т276975.84
У130162.74
Ф12180.26
Х40390.85
Ц16130.34
Ч63481.34
Ш41100.87
Щ18290.39
Ь-Ъ89651.89
Ы100182.11
Э12330.26
Ю38280.81
Я117162.47
Диаграма использования букв книги № 387814: Лилия долины (Оноре де Бальзак)

Части речи

Определенных частей речи (ОЧР)89817 слов
Не определенных частей речи (НОЧР)168 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.2340826.062
Глаг.1102518.591
Мест.-сущ.1102512.275
Предл.71959.928
Союз70938
Прилаг.71958.011
Нареч.36014.009
Местоим-прилаг.60086.689
Частица40714.533
Местоим. нареч.11751.308
Числит.4420.492
Числит-прилаг.1310.146
Междомет.530.059
Часть комп.
сложн. слова
00.000

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.45.4951.3625.3530.8240.6616.5410.3021.1813.044.430.900.190.350.00
Глаг.34.1919.9134.5638.1913.1213.337.4614.017.932.190.720.210.100.00
Мест.-сущ.17.0745.096.989.818.438.399.094.709.662.620.690.180.040.00
Предл.44.511.2821.300.330.6312.670.4115.970.450.091.120.510.000.00
Союз13.2417.8916.126.072.826.484.954.145.421.450.300.080.010.00
Прилаг.55.514.132.083.946.374.640.711.490.750.300.100.010.070.00
Нареч.2.6216.953.823.602.863.692.321.222.450.300.240.010.020.00
Местоим-прилаг.33.468.185.442.191.3910.101.531.651.840.630.290.190.000.00
Частица8.9118.174.693.561.292.301.871.881.540.780.290.040.000.00
Местоим. нареч.1.112.462.150.601.151.281.400.452.170.260.060.000.000.00
Числит.3.430.300.060.090.160.510.040.090.010.020.180.030.000.00
Числит-прилаг.0.980.080.090.040.030.120.010.000.080.000.020.000.000.00
Междомет.0.090.110.110.030.070.040.000.120.000.010.000.000.000.00
Часть комп.
сложн. слова
0.000.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.15.8121.1323.3423.6725.89
Глаг.9.9725.1325.2221.8520.89
Мест.-сущ.21.6815.0012.7513.0013.12
Предл.10.795.308.8010.8910.37
Союз15.013.474.326.166.61
Прилаг.3.926.136.887.638.32
Нареч.6.405.534.443.963.47
Местоим-прилаг.6.387.615.596.696.41
Частица6.547.686.134.293.49
Местоим. нареч.2.321.711.670.910.77
Числит.0.270.760.630.670.50
Числит-прилаг.0.140.440.210.240.17
Междомет.0.770.090.020.050.00
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.27.2426.8727.1725.2625.00
Глаг.18.1118.5718.3819.8819.25
Мест.-сущ.11.8911.6711.7911.5411.31
Предл.10.609.889.4310.4110.63
Союз7.538.027.668.199.02
Прилаг.8.107.817.588.047.35
Нареч.3.823.733.993.643.58
Местоим-прилаг.6.426.957.336.247.05
Частица4.214.644.574.674.91
Местоим. нареч.1.370.991.321.151.51
Числит.0.570.640.620.890.22
Числит-прилаг.0.130.160.140.060.15
Междомет.0.000.050.030.030.00
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
1112131415
Сущ.23.6525.6325.3925.4825.38
Глаг.19.5817.5917.9118.3419.33
Мест.-сущ.11.8611.1612.1011.9710.71
Предл.10.1311.379.7311.2411.57
Союз9.199.389.597.678.09
Прилаг.8.798.078.178.068.58
Нареч.4.464.093.783.953.56
Местоим-прилаг.6.256.157.087.147.68
Частица4.074.474.254.263.60
Местоим. нареч.1.401.371.271.380.98
Числит.0.460.620.580.350.37
Числит-прилаг.0.160.100.110.120.12
Междомет.0.000.000.040.040.04
Часть комп.
сложн. слова
0.000.000.000.000.00