Лингвистический анализ: Утраченные иллюзии (Оноре Бальзак)


- Утраченные иллюзии (пер. Нина Герасимовна Яковлева) (и.с. Библиотека всемирной литературы-68) 5.3 Мб, 765с. скачать: (fb2) (исправленную)  читать: (полностью)  - Оноре де Бальзак

Общая статистика

Длина текста1376714 знаков
Длина диалогов505151 знаков
Слов в произведении (СВП)201467 слов
Приблизительно страниц765 стр.
Средняя длина слова5.50 знаков
Предложений в произведении (ПВП)11765 предл.
Средняя длина предложения (СДП)114.17 знаков
Доля диалогов в тексте36.69 %
Доля авторского текста63.31 %
СДП диалогов106.43 знаков
СДП авторского текста135.13 знаков
Использование диалогов по тексту книги № 267883: Утраченные иллюзии (Оноре Бальзак)
Максимальный фрагмент авторского текста - 68325 знаков (в страницах - примерно 38, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов39253
Активный словарный запас (АСЗ)38028
Активный не словарный запас (АНСЗ)1225
Удельный АСЗ на 3000 слов текста1631.55203587 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4376.58360451 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста24847.5868265 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 267883: Утраченные иллюзии (Оноре Бальзак)
Максимальный УАСЗ-3000 (1836) наблюдается примерно на 4 странице
Минимальный УАСЗ-3000 (1449) наблюдается примерно на 323 странице
Рост АСЗ книги № 267883: Утраченные иллюзии (Оноре Бальзак)

Буквы и знаки препинания

Всего букв1105983 букв
Всего знаков препинания45737 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 27083134.43
. 1084453.83
- 206910.27
? 10265.09
! 15577.73
... 00.00
!.. 1530.76
?.. 840.42
!!! 10.00
?! 80.04
" 00.00
() 3831.90
: 10355.14
; 14947.42
БукваКол-во (шт.)Частота использования (в %)
А903228.17
Б203761.84
В515854.66
Г190491.72
Д345823.13
Е-Ё954448.63
Ж190491.72
З189641.71
И-Й894488.09
К356843.23
Л523754.74
М329292.98
Н706106.38
О11514310.41
П303382.74
Р503124.55
С617715.59
Т688976.23
У307922.78
Ф30260.27
Х85830.78
Ц45490.41
Ч152491.38
Ш92180.83
Щ43090.39
Ь-Ъ225782.04
Ы224742.03
Э35800.32
Ю97430.88
Я213701.93
Диаграма использования букв книги № 267883: Утраченные иллюзии (Оноре Бальзак)

Части речи

Определенных частей речи (ОЧР)200449 слов
Не определенных частей речи (НОЧР)1018 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.6335131.605
Глаг.1835917.546
Мест.-сущ.183599.159
Предл.1630510.351
Союз146917
Прилаг.163058.134
Нареч.79193.951
Местоим-прилаг.106305.303
Частица82144.098
Местоим. нареч.23401.167
Числит.20541.025
Числит-прилаг.4840.241
Междомет.1800.090
Часть комп.
сложн. слова
30.001

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.76.3262.8621.8640.2140.5822.9512.8516.6513.714.752.070.680.520.01
Глаг.45.2719.6821.9836.0311.2412.897.519.917.011.811.710.330.090.00
Мест.-сущ.16.7633.464.456.875.426.396.433.236.301.390.680.150.040.00
Предл.53.771.2416.070.440.8013.250.5913.180.280.142.950.770.010.00
Союз16.7314.3312.016.302.795.574.553.865.011.370.650.080.030.00
Прилаг.56.904.752.143.505.414.890.961.340.870.280.230.020.050.00
Нареч.3.7714.933.173.802.844.252.031.312.450.360.520.050.030.00
Местоим-прилаг.26.046.254.082.521.226.951.271.501.870.790.400.140.000.00
Частица9.6614.804.222.751.521.881.961.461.780.590.310.020.020.00
Местоим. нареч.1.352.531.380.690.991.521.200.341.430.150.050.020.010.00
Числит.7.410.390.110.270.310.640.090.090.130.020.620.120.020.00
Числит-прилаг.1.840.090.040.080.080.100.020.040.080.000.030.000.000.00
Междомет.0.210.130.090.040.080.060.040.120.040.010.000.000.050.00
Часть комп.
сложн. слова
0.000.000.000.000.000.010.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.26.1325.7128.2130.5231.97
Глаг.9.4924.5722.5921.1619.41
Мест.-сущ.14.2210.779.478.718.42
Предл.10.446.559.039.9410.54
Союз13.684.685.135.466.31
Прилаг.5.506.187.328.509.12
Нареч.5.635.404.664.003.70
Местоим-прилаг.4.576.244.984.974.92
Частица6.016.726.154.373.42
Местоим. нареч.2.371.631.160.991.00
Числит.0.711.040.951.071.01
Числит-прилаг.0.340.410.230.270.18
Междомет.0.920.100.110.040.00
Часть комп.
сложн. слова
0.000.000.010.000.00

Номер слова в предложении
678910
Сущ.31.7931.7831.4231.7631.08
Глаг.19.2818.1517.8516.8817.27
Мест.-сущ.8.288.758.638.669.06
Предл.10.0311.3311.2911.9610.45
Союз7.007.047.497.337.91
Прилаг.8.208.528.328.328.43
Нареч.3.783.543.633.623.81
Местоим-прилаг.5.274.995.355.225.79
Частица3.863.653.913.773.77
Местоим. нареч.1.200.940.831.091.08
Числит.1.031.001.031.171.04
Числит-прилаг.0.250.290.210.170.28
Междомет.0.020.010.050.040.05
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
1112131415
Сущ.30.3031.3130.9930.0431.14
Глаг.17.3317.5316.8216.7917.19
Мест.-сущ.8.649.189.019.417.89
Предл.11.7511.0311.5511.2410.88
Союз7.787.637.637.488.57
Прилаг.8.418.489.008.938.47
Нареч.3.633.813.863.573.35
Местоим-прилаг.5.724.935.255.736.01
Частица3.883.433.704.343.99
Местоим. нареч.1.091.301.061.131.19
Числит.1.231.090.921.061.10
Числит-прилаг.0.210.240.190.220.20
Междомет.0.030.040.020.050.02
Часть комп.
сложн. слова
0.000.000.000.000.00