Лингвистический анализ: Том 10. (Марк Твен)


- Том 10. (пер. Ирина Гавриловна Гурова, ...) (а.с. Марк Твен. Собрание сочинений в 12 томах -10) 2.89 Мб, 664с. скачать: (fb2) (исправленную)  читать: (полностью)  - Марк Твен

Общая статистика

Длина текста1194194 знаков
Длина диалогов225582 знаков
Слов в произведении (СВП)183578 слов
Приблизительно страниц664 стр.
Средняя длина слова5.22 знаков
Предложений в произведении (ПВП)12047 предл.
Средняя длина предложения (СДП)96.31 знаков
Доля диалогов в тексте18.89 %
Доля авторского текста81.11 %
СДП диалогов96.65 знаков
СДП авторского текста124.04 знаков
Использование диалогов по тексту книги № 350436: Том 10. (Марк Твен)
Максимальный фрагмент авторского текста - 86013 знаков (в страницах - примерно 48, начинается где-то с 615 страницы)

Активный словарный запас

Использовано уникальных слов36767
Активный словарный запас (АСЗ)35775
Активный не словарный запас (АНСЗ)992
Удельный АСЗ на 3000 слов текста1520.43403729 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4115.68350125 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста24256.4729357 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 350436: Том 10. (Марк Твен)
Максимальный УАСЗ-3000 (1758) наблюдается примерно на 257 странице
Минимальный УАСЗ-3000 (1208) наблюдается примерно на 477 странице
Рост АСЗ книги № 350436: Том 10. (Марк Твен)

Буквы и знаки препинания

Всего букв956772 букв
Всего знаков препинания38753 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 21742118.43
. 1013555.21
- 199510.87
? 9795.33
! 14467.88
... 50.03
!.. 260.14
?.. 60.03
!!! 00.00
?! 210.11
" 10.01
() 3822.08
: 11706.37
; 8454.60
БукваКол-во (шт.)Частота использования (в %)
А732107.65
Б160681.68
В422924.42
Г170031.78
Д308123.22
Е-Ё827968.65
Ж170031.78
З160651.68
И-Й774508.09
К312913.27
Л443524.64
М319113.34
Н627516.56
О10642211.12
П265242.77
Р412144.31
С520775.44
Т606606.34
У257472.69
Ф14160.15
Х86690.91
Ц37680.39
Ч149671.56
Ш78060.82
Щ31900.33
Ь-Ъ189871.98
Ы186051.94
Э37790.39
Ю61550.64
Я212152.22
Диаграма использования букв книги № 350436: Том 10. (Марк Твен)

Части речи

Определенных частей речи (ОЧР)183285 слов
Не определенных частей речи (НОЧР)293 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4605825.129
Глаг.2020017.651
Мест.-сущ.2020011.021
Предл.1337410.080
Союз1768310
Прилаг.133747.297
Нареч.96665.274
Местоим-прилаг.108305.909
Частица88084.806
Местоим. нареч.32341.764
Числит.18711.021
Числит-прилаг.4650.254
Междомет.2430.133
Часть комп.
сложн. слова
260.014

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.49.9142.7122.6934.3742.9314.8411.8414.039.874.782.040.690.520.06
Глаг.31.0219.0723.6534.4920.9111.8810.5011.218.463.341.430.290.230.02
Мест.-сущ.13.0639.806.688.277.646.5210.244.0810.402.800.590.050.080.00
Предл.47.421.5618.570.491.1612.360.4615.160.140.152.380.850.080.03
Союз13.6620.8618.657.654.515.597.896.007.433.140.850.160.080.02
Прилаг.50.333.541.922.505.925.370.861.060.840.320.280.010.030.00
Нареч.3.9617.925.524.695.404.214.091.913.530.780.610.070.060.01
Местоим-прилаг.28.345.724.252.852.078.041.732.252.340.890.440.150.030.00
Частица4.6321.034.953.802.212.123.022.462.451.030.310.040.020.00
Местоим. нареч.1.063.572.781.052.951.131.830.512.300.310.100.020.020.00
Числит.5.940.520.250.370.520.720.190.200.090.041.160.190.010.00
Числит-прилаг.1.680.110.100.160.130.080.040.070.110.020.020.020.000.00
Междомет.0.200.110.190.090.140.070.060.160.090.040.000.000.190.00
Часть комп.
сложн. слова
0.080.000.000.000.000.050.000.000.000.000.000.000.000.01

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.14.2619.7321.7022.4823.87
Глаг.10.0423.2822.2520.5619.92
Мест.-сущ.21.9415.7513.4612.2910.48
Предл.10.777.148.769.6510.39
Союз15.884.996.818.119.03
Прилаг.3.875.096.337.227.62
Нареч.7.336.736.135.585.15
Местоим-прилаг.4.856.215.446.146.05
Частица5.917.435.535.044.49
Местоим. нареч.3.262.121.901.491.54
Числит.0.900.751.041.031.09
Числит-прилаг.0.210.490.300.300.30
Междомет.0.770.270.320.090.07
Часть комп.
сложн. слова
0.020.000.030.030.00

Номер слова в предложении
678910
Сущ.25.7826.1225.8625.3725.64
Глаг.18.1317.2017.7616.7817.16
Мест.-сущ.9.6410.119.149.559.22
Предл.10.6010.3810.8611.5110.58
Союз9.4510.3010.2010.539.95
Прилаг.8.297.587.837.918.48
Нареч.4.794.984.944.845.16
Местоим-прилаг.6.115.826.286.496.16
Частица4.314.334.044.494.83
Местоим. нареч.1.641.651.631.401.25
Числит.0.951.081.090.801.15
Числит-прилаг.0.240.290.260.220.30
Междомет.0.050.150.050.070.11
Часть комп.
сложн. слова
0.020.010.050.040.02

Номер слова в предложении
1112131415
Сущ.25.5124.9225.0826.5324.96
Глаг.17.5316.7216.8716.8516.98
Мест.-сущ.9.699.869.639.579.96
Предл.10.5111.3910.7711.0210.81
Союз10.6610.6110.3910.3410.09
Прилаг.7.267.698.737.698.08
Нареч.4.754.354.394.495.02
Местоим-прилаг.6.466.616.096.146.30
Частица4.454.194.984.474.52
Местоим. нареч.1.781.991.531.552.09
Числит.1.131.381.261.060.90
Числит-прилаг.0.210.210.250.180.20
Междомет.0.020.030.040.080.09
Часть комп.
сложн. слова
0.050.030.000.020.00