Лингвистический анализ: Парижские тайны (Эжен Сю)


- Парижские тайны (и.с. Семейный роман) 5.39 Мб, 1686с. скачать: (fb2) (исправленную)  читать: (полностью)  - Эжен Жозеф Сю

Общая статистика

Длина текста3033089 знаков
Длина диалогов1846383 знаков
Слов в произведении (СВП)464678 слов
Приблизительно страниц1686 стр.
Средняя длина слова5.15 знаков
Предложений в произведении (ПВП)39336 предл.
Средняя длина предложения (СДП)74.34 знаков
Доля диалогов в тексте60.87 %
Доля авторского текста39.13 %
СДП диалогов45.26 знаков
СДП авторского текста107.59 знаков
Использование диалогов по тексту книги № 99355: Парижские тайны (Эжен Сю)
Максимальный фрагмент авторского текста - 46857 знаков (в страницах - примерно 26, начинается где-то с 275 страницы)

Активный словарный запас

Использовано уникальных слов51882
Активный словарный запас (АСЗ)50993
Активный не словарный запас (АНСЗ)889
Удельный АСЗ на 3000 слов текста1422.37366095 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3678.84304580 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста19890.8751555 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 99355: Парижские тайны (Эжен Сю)
Максимальный УАСЗ-3000 (1821) наблюдается примерно на 1672 странице
Минимальный УАСЗ-3000 (1122) наблюдается примерно на 925 странице
Рост АСЗ книги № 99355: Парижские тайны (Эжен Сю)

Буквы и знаки препинания

Всего букв2393531 букв
Всего знаков препинания112523 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 62150133.75
. 1975542.51
- 42249.09
? 45579.81
! 490710.56
... 947020.38
!.. 9702.09
?.. 4010.86
!!! 550.12
?! 1220.26
" 70.02
() 1730.37
: 25175.42
; 32156.92
БукваКол-во (шт.)Частота использования (в %)
А1932738.07
Б429441.79
В1040474.35
Г433291.81
Д775233.24
Е-Ё2070018.65
Ж433291.81
З389851.63
И-Й1758387.35
К773783.23
Л1082474.52
М812723.40
Н1512306.32
О27165511.35
П637242.66
Р1052884.40
С1266215.29
Т1501386.27
У683802.86
Ф56070.23
Х191840.80
Ц84890.35
Ч372161.55
Ш205120.86
Щ84510.35
Ь-Ъ524222.19
Ы468821.96
Э92120.38
Ю169190.71
Я533302.23
Диаграма использования букв книги № 99355: Парижские тайны (Эжен Сю)

Части речи

Определенных частей речи (ОЧР)463909 слов
Не определенных частей речи (НОЧР)769 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.11388424.549
Глаг.5892118.061
Мест.-сущ.5892112.701
Предл.333199.520
Союз410129
Прилаг.333197.182
Нареч.246445.312
Местоим-прилаг.280836.054
Частица228114.917
Местоим. нареч.85091.834
Числит.31430.678
Числит-прилаг.5280.114
Междомет.11010.237
Часть комп.
сложн. слова
00.000

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.47.8546.5623.9130.0237.1112.7213.2116.4710.354.721.420.210.940.00
Глаг.35.5320.3128.9434.4117.1510.898.7511.298.143.551.090.140.410.00
Мест.-сущ.15.8841.899.469.409.138.2511.644.8712.133.480.630.080.180.00
Предл.41.671.1821.710.591.2110.860.4915.020.210.151.470.490.130.00
Союз13.3116.5520.446.664.436.036.335.016.472.520.530.050.070.00
Прилаг.45.504.342.502.797.594.851.111.500.890.500.130.010.110.00
Нареч.3.9419.885.154.494.104.674.261.633.550.920.440.010.080.00
Местоим-прилаг.29.216.285.272.161.559.361.951.632.040.660.250.080.090.00
Частица5.6519.396.273.362.612.303.172.042.681.420.240.020.030.00
Местоим. нареч.1.173.732.861.062.821.371.940.512.490.330.060.000.010.00
Числит.4.550.250.170.160.350.430.110.120.070.020.510.040.000.00
Числит-прилаг.0.840.080.040.020.030.040.020.010.030.010.010.000.000.00
Междомет.0.380.160.290.090.320.070.140.440.110.050.000.000.320.00
Часть комп.
сложн. слова
0.000.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.12.0018.8721.5822.8824.58
Глаг.14.1719.1320.9720.8820.35
Мест.-сущ.17.4517.3315.2313.8412.61
Предл.8.816.438.079.159.76
Союз20.076.816.336.817.60
Прилаг.3.065.095.846.646.96
Нареч.7.167.216.335.564.88
Местоим-прилаг.4.606.645.766.286.28
Частица7.148.627.175.384.53
Местоим. нареч.3.112.771.911.661.60
Числит.0.460.560.590.750.69
Числит-прилаг.0.050.170.060.100.11
Междомет.1.900.390.150.050.06
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.25.2526.0926.2626.0325.18
Глаг.19.3018.5018.0618.5618.27
Мест.-сущ.11.5611.9711.6311.5511.35
Предл.10.1910.5210.3510.2110.68
Союз8.117.798.308.258.58
Прилаг.7.317.297.727.448.29
Нареч.5.015.034.644.734.67
Местоим-прилаг.6.466.446.136.286.25
Частица4.273.924.334.544.26
Местоим. нареч.1.681.591.651.501.63
Числит.0.720.720.780.750.69
Числит-прилаг.0.100.100.130.120.13
Междомет.0.030.060.030.050.03
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
1112131415
Сущ.25.3925.9125.4325.6925.55
Глаг.17.7917.0617.6017.4118.01
Мест.-сущ.11.8311.5911.1910.7610.97
Предл.10.8610.1510.8410.9310.91
Союз8.608.419.008.908.40
Прилаг.8.018.628.358.278.22
Нареч.4.524.924.834.724.88
Местоим-прилаг.6.316.286.556.346.58
Частица3.954.403.804.443.79
Местоим. нареч.1.741.781.661.701.85
Числит.0.830.720.650.660.67
Числит-прилаг.0.140.130.090.160.11
Междомет.0.020.020.020.030.08
Часть комп.
сложн. слова
0.000.000.000.000.00