Лингвистический анализ: Том 3 (Марк Твен)


- Том 3 (пер. Нора Галь, ...) (а.с. Марк Твен. Собрание сочинений в 12 томах -3) 3.29 Мб, 532с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Марк Твен

Общая статистика

Длина текста956782 знаков
Длина диалогов269871 знаков
Слов в произведении (СВП)146617 слов
Приблизительно страниц532 стр.
Средняя длина слова5.24 знаков
Предложений в произведении (ПВП)9330 предл.
Средняя длина предложения (СДП)99.75 знаков
Доля диалогов в тексте28.21 %
Доля авторского текста71.79 %
СДП диалогов98.84 знаков
СДП авторского текста131.91 знаков
Использование диалогов по тексту книги № 341445: Том 3 (Марк Твен)
Максимальный фрагмент авторского текста - 31631 знаков (в страницах - примерно 18, начинается где-то с 536 страницы)

Активный словарный запас

Использовано уникальных слов29666
Активный словарный запас (АСЗ)27965
Активный не словарный запас (АНСЗ)1701
Удельный АСЗ на 3000 слов текста1527.97126108 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4076.92103483 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста22941.3966274 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 341445: Том 3 (Марк Твен)
Максимальный УАСЗ-3000 (1768) наблюдается примерно на 511 странице
Минимальный УАСЗ-3000 (1241) наблюдается примерно на 330 странице
Рост АСЗ книги № 341445: Том 3 (Марк Твен)

Буквы и знаки препинания

Всего букв760593 букв
Всего знаков препинания30994 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 17149116.96
. 791253.96
- 154410.53
? 10026.83
! 11407.78
... 00.00
!.. 90.06
?.. 40.03
!!! 40.03
?! 90.06
" 440.30
() 3142.14
: 8245.62
; 10397.09
БукваКол-во (шт.)Частота использования (в %)
А593357.80
Б130721.72
В330324.34
Г143691.89
Д244133.21
Е-Ё668048.78
Ж143691.89
З124221.63
И-Й616578.11
К241693.18
Л365464.80
М235443.10
Н509596.70
О8526111.21
П214652.82
Р329714.33
С420605.53
Т470846.19
У209532.75
Ф16440.22
Х68380.90
Ц24270.32
Ч114681.51
Ш61520.81
Щ25130.33
Ь-Ъ154582.03
Ы140971.85
Э26400.35
Ю43650.57
Я148101.95
Диаграма использования букв книги № 341445: Том 3 (Марк Твен)

Части речи

Определенных частей речи (ОЧР)145023 слов
Не определенных частей речи (НОЧР)1594 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.3790026.134
Глаг.1482417.317
Мест.-сущ.1482410.222
Предл.1047410.018
Союз1407910
Прилаг.104747.222
Нареч.84165.803
Местоим-прилаг.77635.353
Частица76925.304
Местоим. нареч.27261.880
Числит.11240.775
Числит-прилаг.2280.157
Междомет.1470.101
Часть комп.
сложн. слова
90.006

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.55.8548.0119.0234.7144.0514.4314.2312.0711.185.131.700.490.450.01
Глаг.35.3118.6521.7034.0419.3811.259.509.759.163.011.110.150.140.01
Мест.-сущ.14.3430.876.357.608.226.3910.374.0710.333.090.460.060.060.00
Предл.47.961.8618.340.521.1012.740.7614.300.230.141.500.620.070.03
Союз16.6418.4716.297.975.365.739.005.298.203.390.590.100.050.01
Прилаг.49.143.422.122.725.965.211.050.970.960.410.170.010.060.01
Нареч.4.9220.175.004.425.505.254.931.724.740.810.510.040.020.00
Местоим-прилаг.24.425.524.512.342.056.332.222.082.441.210.340.050.030.00
Частица5.5621.666.024.132.682.633.812.502.621.120.280.030.010.00
Местоим. нареч.1.413.922.481.332.171.531.930.532.940.450.100.000.010.00
Числит.4.450.410.250.260.460.500.180.140.090.030.940.020.010.00
Числит-прилаг.1.030.120.060.060.040.130.000.010.100.000.030.000.000.00
Междомет.0.240.100.080.060.120.070.060.100.040.010.010.000.110.00
Часть комп.
сложн. слова
0.030.000.000.000.000.030.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.19.7821.6422.0825.1625.75
Глаг.9.2221.0522.8920.9419.21
Мест.-сущ.16.0614.1911.5810.939.82
Предл.10.696.239.029.9110.39
Союз17.695.926.457.378.93
Прилаг.3.234.896.086.607.49
Нареч.6.747.577.256.525.49
Местоим-прилаг.4.275.664.774.765.18
Частица7.488.917.025.315.25
Местоим. нареч.3.152.611.631.651.63
Числит.0.690.760.860.670.66
Числит-прилаг.0.230.350.190.160.08
Междомет.0.750.220.160.030.09
Часть комп.
сложн. слова
0.000.000.020.000.01

Номер слова в предложении
678910
Сущ.25.9127.0027.0125.9325.36
Глаг.18.2816.4617.2317.7516.68
Мест.-сущ.9.619.459.1610.088.93
Предл.10.6710.5510.3110.4910.86
Союз10.0810.4310.369.9810.90
Прилаг.7.807.177.387.527.63
Нареч.5.465.645.005.565.57
Местоим-прилаг.4.885.585.955.255.88
Частица4.484.954.834.875.08
Местоим. нареч.1.801.661.821.872.04
Числит.0.800.920.840.580.88
Числит-прилаг.0.140.120.120.050.15
Междомет.0.070.080.020.050.04
Часть комп.
сложн. слова
0.010.000.000.000.00

Номер слова в предложении
1112131415
Сущ.25.8925.2626.0224.7025.97
Глаг.16.4016.8716.8916.1316.21
Мест.-сущ.9.4910.169.929.779.60
Предл.10.9311.4610.1810.7211.26
Союз10.0910.3810.5911.159.92
Прилаг.7.877.587.618.097.71
Нареч.5.404.965.305.515.33
Местоим-прилаг.5.675.316.186.075.74
Частица5.475.184.385.005.19
Местоим. нареч.1.711.721.901.911.97
Числит.0.950.990.810.740.98
Числит-прилаг.0.100.090.120.180.11
Междомет.0.020.020.070.000.00
Часть комп.
сложн. слова
0.000.000.020.030.00