Лингвистический анализ: Позолоченный век (Марк Твен)


- Позолоченный век (и.с. Марк Твен. Собрание сочинений в 12 томах-3) 1.85 Мб, 532с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Марк Твен - Чарльз Дэдли Уорнер

Общая статистика

Длина текста957235 знаков
Длина диалогов269572 знаков
Слов в произведении (СВП)146623 слов
Приблизительно страниц532 стр.
Средняя длина слова5.23 знаков
Предложений в произведении (ПВП)10544 предл.
Средняя длина предложения (СДП)87.98 знаков
Доля диалогов в тексте28.16 %
Доля авторского текста71.84 %
СДП диалогов71.62 знаков
СДП авторского текста110.39 знаков
Использование диалогов по тексту книги № 192308: Позолоченный век (Марк Твен)
Максимальный фрагмент авторского текста - 25191 знаков (в страницах - примерно 14, начинается где-то с 197 страницы)

Активный словарный запас

Использовано уникальных слов29440
Активный словарный запас (АСЗ)27728
Активный не словарный запас (АНСЗ)1712
Удельный АСЗ на 3000 слов текста1528.06470298 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4075.16409483 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста22809.4115874 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 192308: Позолоченный век (Марк Твен)
Максимальный УАСЗ-3000 (1720) наблюдается примерно на 511 странице
Минимальный УАСЗ-3000 (1249) наблюдается примерно на 334 странице
Рост АСЗ книги № 192308: Позолоченный век (Марк Твен)

Буквы и знаки препинания

Всего букв758478 букв
Всего знаков препинания37177 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 17069116.41
. 831156.68
- 540036.83
? 10036.84
! 11407.78
... 5283.60
!.. 90.06
?.. 40.03
!!! 40.03
?! 90.06
" 153010.43
() 3122.13
: 8195.59
; 10397.09
БукваКол-во (шт.)Частота использования (в %)
А593957.83
Б130721.72
В329944.35
Г144811.91
Д243903.22
Е-Ё665428.77
Ж144811.91
З123791.63
И-Й614068.10
К240953.18
Л365634.82
М234153.09
Н506636.68
О8490211.19
П209502.76
Р329654.35
С420655.55
Т470426.20
У209192.76
Ф16680.22
Х67940.90
Ц24330.32
Ч113971.50
Ш61200.81
Щ25010.33
Ь-Ъ154332.03
Ы140371.85
Э26580.35
Ю43440.57
Я148121.95
Диаграма использования букв книги № 192308: Позолоченный век (Марк Твен)

Части речи

Определенных частей речи (ОЧР)144727 слов
Не определенных частей речи (НОЧР)1896 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.3790326.189
Глаг.1481217.320
Мест.-сущ.1481210.234
Предл.1040410.003
Союз1401310
Прилаг.104047.189
Нареч.83955.801
Местоим-прилаг.77465.352
Частица76905.313
Местоим. нареч.27211.880
Числит.11240.777
Числит-прилаг.2180.151
Междомет.1480.102
Часть комп.
сложн. слова
90.006

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.56.7647.9719.0134.6843.9014.3614.2412.0411.205.101.700.460.460.01
Глаг.35.2318.6421.7334.0119.4011.309.499.779.183.011.120.170.150.01
Мест.-сущ.14.3330.936.367.618.246.3910.394.0810.323.100.460.060.060.00
Предл.48.041.7918.370.501.0812.650.7514.280.230.151.510.580.070.03
Союз16.4918.4616.327.945.355.648.975.298.243.400.590.080.050.01
Прилаг.48.983.442.122.695.895.111.060.970.950.410.180.010.060.01
Нареч.4.9120.225.014.395.505.194.911.724.770.820.500.050.020.00
Местоим-прилаг.24.415.504.512.352.056.342.222.072.441.210.350.050.030.00
Частица5.5821.726.034.152.662.623.812.512.631.120.280.030.010.00
Местоим. нареч.1.423.902.491.332.161.531.930.532.940.450.100.000.010.00
Числит.4.460.410.250.260.460.500.180.150.090.030.950.020.010.00
Числит-прилаг.0.970.120.060.060.030.130.000.010.100.000.030.000.000.00
Междомет.0.260.100.080.040.120.080.060.100.040.010.010.000.110.00
Часть комп.
сложн. слова
0.030.000.000.000.000.030.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.20.1422.1022.0824.9326.01
Глаг.10.0320.7822.7821.0819.02
Мест.-сущ.15.6114.3811.6510.769.86
Предл.10.246.219.159.9710.54
Союз17.365.836.407.408.89
Прилаг.3.254.756.046.647.59
Нареч.6.747.567.236.505.43
Местоим-прилаг.4.155.584.824.835.12
Частица7.578.856.995.425.13
Местоим. нареч.3.112.591.731.641.61
Числит.0.730.760.790.650.66
Числит-прилаг.0.220.340.190.170.10
Междомет.0.850.260.110.010.05
Часть комп.
сложн. слова
0.000.000.020.000.00

Номер слова в предложении
678910
Сущ.26.1726.7127.2826.2625.10
Глаг.17.8616.4917.2617.4616.95
Мест.-сущ.9.549.279.1110.149.00
Предл.10.8210.7410.1910.6811.05
Союз9.9910.6010.409.9410.82
Прилаг.7.707.377.437.547.67
Нареч.5.505.594.845.495.29
Местоим-прилаг.4.925.626.005.195.97
Частица4.604.924.694.685.04
Местоим. нареч.1.881.561.731.922.03
Числит.0.820.970.930.620.91
Числит-прилаг.0.140.120.110.050.15
Междомет.0.040.030.030.020.00
Часть комп.
сложн. слова
0.010.020.000.000.00

Номер слова в предложении
1112131415
Сущ.25.9925.0325.9624.9925.76
Глаг.16.1616.6516.9216.0916.10
Мест.-сущ.9.5310.059.709.569.66
Предл.10.9811.6710.1410.9811.50
Союз9.9910.5710.6611.119.89
Прилаг.7.807.707.728.098.13
Нареч.5.425.025.045.355.27
Местоим-прилаг.5.855.346.406.035.67
Частица5.525.184.505.035.02
Местоим. нареч.1.711.761.881.901.96
Числит.0.920.950.900.710.94
Числит-прилаг.0.100.090.120.130.11
Междомет.0.000.000.020.000.00
Часть комп.
сложн. слова
0.020.000.020.030.00