Лингвистический анализ: Том 12. Из 'Автобиографии'. Из записных книжек 1865-1905. Избранные письма (Марк Твен)


- Том 12. Из 'Автобиографии'. Из записных книжек 1865-1905. Избранные письма (а.с. Марк Твен. Собрание сочинений в 12 томах -12) 2.47 Мб, 716с. скачать: (fb2) (исправленную)  читать: (полностью)  - Марк Твен

Общая статистика

Длина текста1287938 знаков
Длина диалогов41999 знаков
Слов в произведении (СВП)199422 слов
Приблизительно страниц716 стр.
Средняя длина слова5.18 знаков
Предложений в произведении (ПВП)12317 предл.
Средняя длина предложения (СДП)101.63 знаков
Доля диалогов в тексте3.26 %
Доля авторского текста96.74 %
СДП диалогов70.55 знаков
СДП авторского текста106.10 знаков
Использование диалогов по тексту книги № 161370: Том 12. Из
Максимальный фрагмент авторского текста - 106843 знаков (в страницах - примерно 59, начинается где-то с 264 страницы)

Активный словарный запас

Использовано уникальных слов36420
Активный словарный запас (АСЗ)35147
Активный не словарный запас (АНСЗ)1273
Удельный АСЗ на 3000 слов текста1497.203913 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4015.182764 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста23037.3781068 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 161370: Том 12. Из
Максимальный УАСЗ-3000 (1743) наблюдается примерно на 527 странице
Минимальный УАСЗ-3000 (1202) наблюдается примерно на 273 странице
Рост АСЗ книги № 161370: Том 12. Из

Буквы и знаки препинания

Всего букв1031228 букв
Всего знаков препинания44034 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 22649113.57
. 1179659.15
- 400620.09
? 3992.00
! 4322.17
... 1580.79
!.. 70.04
?.. 30.02
!!! 00.00
?! 70.04
" 17558.80
() 6153.08
: 10085.05
; 11996.01
БукваКол-во (шт.)Частота использования (в %)
А785497.62
Б183001.77
В439064.26
Г187951.82
Д331203.21
Е-Ё908518.81
Ж187951.82
З167871.63
И-Й842528.17
К331133.21
Л483514.69
М350193.40
Н681966.61
О11403311.06
П276092.68
Р455454.42
С559605.43
Т661056.41
У268732.61
Ф18480.18
Х88610.86
Ц39310.38
Ч166681.62
Ш75350.73
Щ31550.31
Ь-Ъ198781.93
Ы197711.92
Э47680.46
Ю70480.68
Я226132.19
Диаграма использования букв книги № 161370: Том 12. Из

Части речи

Определенных частей речи (ОЧР)199036 слов
Не определенных частей речи (НОЧР)386 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.5180326.027
Глаг.2173916.622
Мест.-сущ.2173910.922
Предл.1468310.354
Союз1925810
Прилаг.146837.377
Нареч.104005.225
Местоим-прилаг.118565.957
Частица91774.611
Местоим. нареч.33101.663
Числит.25411.277
Числит-прилаг.4940.248
Междомет.710.036
Часть комп.
сложн. слова
120.006

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.57.7939.5624.1636.3843.8815.1911.8814.688.824.802.330.620.170.02
Глаг.28.0417.2722.0132.9519.4611.389.9611.068.902.682.110.310.070.01
Мест.-сущ.13.4340.045.788.357.526.289.943.6310.762.730.610.130.010.02
Предл.49.141.2219.200.460.9211.890.5716.120.130.072.980.790.050.01
Союз15.0718.6118.949.004.115.967.745.847.353.000.930.190.010.01
Прилаг.48.423.222.323.157.125.871.201.050.740.300.310.040.020.00
Нареч.4.0115.535.134.855.905.244.871.803.120.930.780.060.010.00
Местоим-прилаг.28.985.604.733.121.897.521.702.242.170.930.510.170.010.00
Частица4.6221.144.193.721.902.612.732.261.620.900.360.050.010.00
Местоим. нареч.1.023.522.300.973.171.071.400.582.290.220.090.010.000.00
Числит.7.990.330.300.480.650.620.230.230.110.051.680.100.000.00
Числит-прилаг.1.600.130.130.100.180.110.020.040.090.010.080.020.000.00
Междомет.0.110.040.040.020.040.010.010.060.020.020.000.000.010.00
Часть комп.
сложн. слова
0.030.000.000.000.000.040.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.19.6123.7924.1425.4625.88
Глаг.7.6124.4620.8119.2518.18
Мест.-сущ.24.0812.8012.5011.799.64
Предл.11.777.139.3410.6310.86
Союз12.794.217.327.809.21
Прилаг.4.264.986.787.447.62
Нареч.6.556.055.884.865.49
Местоим-прилаг.5.226.444.845.325.77
Частица3.786.835.034.544.10
Местоим. нареч.3.091.801.491.331.33
Числит.0.791.181.561.341.62
Числит-прилаг.0.290.290.280.220.28
Междомет.0.140.040.050.030.03
Часть комп.
сложн. слова
0.010.010.000.000.00

Номер слова в предложении
678910
Сущ.26.2327.0726.6425.6624.21
Глаг.16.7716.0015.2316.6016.59
Мест.-сущ.9.678.899.549.789.45
Предл.10.7411.3010.9710.9511.57
Союз10.019.9110.6910.4411.05
Прилаг.8.148.687.897.817.89
Нареч.4.974.634.655.184.96
Местоим-прилаг.5.955.906.396.246.42
Частица4.054.044.464.304.68
Местоим. нареч.1.521.571.691.421.63
Числит.1.601.791.571.441.20
Числит-прилаг.0.310.170.230.150.31
Междомет.0.030.020.040.030.03
Часть комп.
сложн. слова
0.000.010.020.000.00

Номер слова в предложении
1112131415
Сущ.25.2325.7924.1923.8324.57
Глаг.16.2416.0315.2916.8415.58
Мест.-сущ.10.4410.019.949.999.74
Предл.10.8511.3211.5910.9711.41
Союз10.9110.7010.3210.5711.37
Прилаг.7.427.617.678.078.00
Нареч.4.644.635.405.544.95
Местоим-прилаг.6.335.827.186.095.94
Частица4.664.905.034.874.95
Местоим. нареч.1.521.571.731.671.80
Числит.1.491.351.341.331.43
Числит-прилаг.0.250.240.290.240.24
Междомет.0.010.000.030.000.00
Часть комп.
сложн. слова
0.000.030.000.000.02