Лингвистический анализ: Том 10. Рассказы. Очерки. Публицистика. 1863-1893. (Марк Твен)


- Том 10. Рассказы. Очерки. Публицистика. 1863-1893. (а.с. Марк Твен. Собрание сочинений в 12 томах -10) 2.41 Мб, 672с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Марк Твен

Общая статистика

Длина текста1209416 знаков
Длина диалогов203433 знаков
Слов в произведении (СВП)185745 слов
Приблизительно страниц672 стр.
Средняя длина слова5.22 знаков
Предложений в произведении (ПВП)12994 предл.
Средняя длина предложения (СДП)90.25 знаков
Доля диалогов в тексте16.82 %
Доля авторского текста83.18 %
СДП диалогов79.38 знаков
СДП авторского текста110.49 знаков
Использование диалогов по тексту книги № 152494: Том 10. Рассказы. Очерки. Публицистика. 1863-1893. (Марк Твен)
Максимальный фрагмент авторского текста - 82443 знаков (в страницах - примерно 46, начинается где-то с 602 страницы)

Активный словарный запас

Использовано уникальных слов37206
Активный словарный запас (АСЗ)35857
Активный не словарный запас (АНСЗ)1349
Удельный АСЗ на 3000 слов текста1521.03397522 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4116.12355167 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста24325.5957774 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 152494: Том 10. Рассказы. Очерки. Публицистика. 1863-1893. (Марк Твен)
Максимальный УАСЗ-3000 (1771) наблюдается примерно на 253 странице
Минимальный УАСЗ-3000 (1198) наблюдается примерно на 477 странице
Рост АСЗ книги № 152494: Том 10. Рассказы. Очерки. Публицистика. 1863-1893. (Марк Твен)

Буквы и знаки препинания

Всего букв965066 букв
Всего знаков препинания38430 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 21969118.28
. 1076657.96
- 40.02
? 9875.31
! 14457.78
... 2631.42
!.. 270.15
?.. 60.03
!!! 00.00
?! 210.11
" 3541.91
() 5743.09
: 11736.32
; 8414.53
БукваКол-во (шт.)Частота использования (в %)
А739187.66
Б161731.68
В428104.44
Г171411.78
Д311303.23
Е-Ё836478.67
Ж171411.78
З161791.68
И-Й782088.10
К316603.28
Л446834.63
М321413.33
Н632116.55
О10711111.10
П268592.78
Р418174.33
С526525.46
Т610216.32
У259152.69
Ф14470.15
Х87270.90
Ц38240.40
Ч150261.56
Ш78560.81
Щ32080.33
Ь-Ъ190881.98
Ы186841.94
Э37970.39
Ю61890.64
Я213332.21
Диаграма использования букв книги № 152494: Том 10. Рассказы. Очерки. Публицистика. 1863-1893. (Марк Твен)

Части речи

Определенных частей речи (ОЧР)184681 слов
Не определенных частей речи (НОЧР)1064 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4683725.361
Глаг.2018017.569
Мест.-сущ.2018010.927
Предл.1356010.139
Союз1774610
Прилаг.135607.342
Нареч.96795.241
Местоим-прилаг.108435.871
Частица88024.766
Местоим. нареч.32281.748
Числит.18841.020
Числит-прилаг.4690.254
Междомет.2560.139
Часть комп.
сложн. слова
270.015

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.51.7842.7822.4735.0142.8215.1611.7813.899.834.752.030.690.560.06
Глаг.31.0318.9423.3934.4620.8111.8410.3911.128.403.301.460.290.240.02
Мест.-сущ.12.9739.496.678.197.586.4310.194.0410.222.780.580.050.080.00
Предл.47.871.6118.410.541.2212.640.4715.060.140.152.340.830.080.03
Союз13.7820.7418.517.584.465.607.855.997.363.120.840.160.080.02
Прилаг.50.613.511.922.675.935.380.851.070.840.300.290.010.020.01
Нареч.3.9117.835.494.695.314.194.041.923.520.770.600.060.060.01
Местоим-прилаг.28.115.654.232.822.107.991.722.242.330.890.440.170.030.00
Частица4.6020.844.893.762.192.113.022.432.441.020.310.040.020.00
Местоим. нареч.1.073.562.741.052.891.121.820.512.290.300.100.020.020.00
Числит.5.870.510.260.370.530.750.190.200.090.041.170.200.010.00
Числит-прилаг.1.690.110.100.160.110.080.040.080.110.020.020.020.000.00
Междомет.0.240.110.180.090.140.080.060.160.090.040.000.000.190.00
Часть комп.
сложн. слова
0.080.000.000.000.000.060.000.000.000.000.000.000.000.01

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.15.2120.4022.3323.1824.34
Глаг.10.1023.0322.0020.2619.73
Мест.-сущ.21.0715.5613.1712.0610.41
Предл.10.717.168.829.6910.53
Союз15.594.986.918.068.83
Прилаг.4.445.106.487.317.57
Нареч.7.106.616.035.595.06
Местоим-прилаг.4.786.145.366.016.08
Частица5.837.335.414.964.46
Местоим. нареч.3.182.151.881.461.54
Числит.0.930.771.031.041.10
Числит-прилаг.0.200.500.290.280.29
Междомет.0.860.270.270.070.06
Часть комп.
сложн. слова
0.020.010.040.030.00

Номер слова в предложении
678910
Сущ.26.1826.2025.9825.4925.81
Глаг.18.1417.0817.7016.8417.09
Мест.-сущ.9.4110.058.999.419.17
Предл.10.5710.5110.9011.4710.76
Союз9.3310.2510.2810.589.91
Прилаг.8.377.657.867.998.51
Нареч.4.744.924.894.855.13
Местоим-прилаг.6.105.836.376.516.11
Частица4.334.314.004.374.77
Местоим. нареч.1.601.721.561.331.21
Числит.0.931.051.100.821.13
Числит-прилаг.0.220.300.260.220.32
Междомет.0.040.120.060.070.08
Часть комп.
сложн. слова
0.030.010.050.030.02

Номер слова в предложении
1112131415
Сущ.25.5625.0425.1526.5324.97
Глаг.17.5816.5416.9116.7117.19
Мест.-сущ.9.559.659.689.559.82
Предл.10.5111.4810.7011.1710.92
Союз10.6510.6410.3810.279.97
Прилаг.7.467.768.737.758.11
Нареч.4.724.434.474.415.05
Местоим-прилаг.6.346.666.046.156.16
Частица4.394.145.044.454.52
Местоим. нареч.1.771.941.501.582.06
Числит.1.181.451.161.130.95
Числит-прилаг.0.230.190.230.180.20
Междомет.0.030.050.040.080.07
Часть комп.
сложн. слова
0.030.020.000.040.00