Лингвистический анализ: Отверженные (Виктор Гюго)


- Отверженные (пер. Дебора Григорьевна Лившиц, ...) (и.с. Иностранная литература. Большие книги) 5.98 Мб, 1651с. скачать: (fb2) (исправленную)  читать: (полностью)  - Виктор Гюго

Общая статистика

Длина текста2971370 знаков
Длина диалогов520834 знаков
Слов в произведении (СВП)444436 слов
Приблизительно страниц1651 стр.
Средняя длина слова5.38 знаков
Предложений в произведении (ПВП)35662 предл.
Средняя длина предложения (СДП)80.49 знаков
Доля диалогов в тексте17.53 %
Доля авторского текста82.47 %
СДП диалогов69.80 знаков
СДП авторского текста109.14 знаков
Использование диалогов по тексту книги № 391874: Отверженные (Виктор Гюго)
Максимальный фрагмент авторского текста - 131964 знаков (в страницах - примерно 73, начинается где-то с 703 страницы)

Активный словарный запас

Использовано уникальных слов65920
Активный словарный запас (АСЗ)62738
Активный не словарный запас (АНСЗ)3182
Удельный АСЗ на 3000 слов текста1598.05413881 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4299.91362056 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста25028.2257549 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 391874: Отверженные (Виктор Гюго)
Максимальный УАСЗ-3000 (1898) наблюдается примерно на 672 странице
Минимальный УАСЗ-3000 (1303) наблюдается примерно на 1567 странице
Рост АСЗ книги № 391874: Отверженные (Виктор Гюго)

Буквы и знаки препинания

Всего букв2388045 букв
Всего знаков препинания105085 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 57620129.65
. 2981067.07
- 454510.23
? 31577.10
! 34257.71
... 00.00
!.. 120.03
?.. 160.04
!!! 00.00
?! 50.01
" 00.00
() 2330.52
: 30556.87
; 32077.22
БукваКол-во (шт.)Частота использования (в %)
А1940068.12
Б428041.79
В1104014.62
Г432781.81
Д743783.11
Е-Ё2038858.54
Ж432781.81
З398491.67
И-Й1836897.69
К791003.31
Л1156554.84
М754833.16
Н1570686.58
О26467011.08
П635002.66
Р1077524.51
С1271395.32
Т1451936.08
У686322.87
Ф44490.19
Х194030.81
Ц101850.43
Ч338491.42
Ш205550.86
Щ92940.39
Ь-Ъ468111.96
Ы478362.00
Э95030.40
Ю152030.64
Я466741.95
Диаграма использования букв книги № 391874: Отверженные (Виктор Гюго)

Части речи

Определенных частей речи (ОЧР)443325 слов
Не определенных частей речи (НОЧР)1111 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.12843428.971
Глаг.4365617.993
Мест.-сущ.436569.847
Предл.3425310.554
Союз338178
Прилаг.342537.726
Нареч.216474.883
Местоим-прилаг.237575.359
Частица185554.185
Местоим. нареч.68191.538
Числит.43780.988
Числит-прилаг.10680.241
Междомет.3750.085
Часть комп.
сложн. слова
70.002

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.69.0157.2623.6537.3635.9418.7513.6515.609.855.242.250.780.370.01
Глаг.42.2718.3921.5838.2913.6612.9910.039.577.983.061.670.260.170.00
Мест.-сущ.16.3134.586.056.596.416.497.893.228.351.920.510.100.040.00
Предл.53.551.7018.160.470.9712.570.4314.360.060.072.290.860.050.00
Союз14.2517.5411.266.863.055.595.623.785.681.840.670.110.030.00
Прилаг.50.504.412.443.826.006.011.131.390.850.420.200.040.060.00
Нареч.4.4018.053.974.504.004.253.921.413.010.690.550.050.020.00
Местоим-прилаг.24.106.595.032.711.576.481.861.682.150.800.550.040.030.00
Частица5.7816.983.923.492.182.082.611.831.760.880.300.030.010.00
Местоим. нареч.1.533.651.961.031.920.991.430.421.980.370.070.020.000.00
Числит.6.460.450.200.240.340.830.170.180.070.040.780.110.000.00
Числит-прилаг.1.420.230.120.160.110.150.050.040.070.010.030.010.000.00
Междомет.0.130.090.140.030.110.060.040.090.040.050.000.000.060.00
Часть комп.
сложн. слова
0.000.000.000.000.000.010.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.20.4522.6124.8826.7327.54
Глаг.10.8325.2523.4920.4319.01
Мест.-сущ.19.0513.5110.8010.469.70
Предл.11.766.7710.0310.8011.13
Союз12.354.405.677.017.43
Прилаг.3.855.186.467.137.86
Нареч.6.186.015.495.024.80
Местоим-прилаг.5.625.824.895.195.68
Частица5.017.025.584.564.19
Местоим. нареч.3.241.851.551.411.32
Числит.0.840.950.910.951.10
Числит-прилаг.0.230.560.200.270.22
Междомет.0.610.090.050.030.02
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.27.9728.4228.6728.5128.79
Глаг.18.6217.8418.0117.3017.74
Мест.-сущ.9.138.628.688.758.24
Предл.11.0611.3011.3211.7211.98
Союз7.908.128.198.238.10
Прилаг.8.248.278.378.518.78
Нареч.4.784.654.734.344.39
Местоим-прилаг.5.635.635.405.785.47
Частица4.034.324.114.103.93
Местоим. нареч.1.401.421.301.401.31
Числит.1.021.170.981.110.99
Числит-прилаг.0.170.220.220.220.21
Междомет.0.050.030.020.050.07
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
1112131415
Сущ.28.6128.8329.3627.9128.61
Глаг.16.8916.9217.1417.3717.07
Мест.-сущ.8.648.568.188.758.64
Предл.11.6611.8811.6111.5111.98
Союз8.338.218.588.617.83
Прилаг.8.548.998.478.878.94
Нареч.4.434.384.654.664.58
Местоим-прилаг.6.165.675.675.475.49
Частица4.223.833.603.964.48
Местоим. нареч.1.361.321.491.491.31
Числит.0.991.130.981.090.92
Числит-прилаг.0.130.230.210.240.13
Междомет.0.040.050.060.080.01
Часть комп.
сложн. слова
0.000.000.010.000.00