Лингвистический анализ: Приключения Тома Сойера (Марк Твен)


- Приключения Тома Сойера (пер. Андрей Анатольевич Климов) (а.с. Приключения Тома Сойера -1) (и.с. Мир приключений и тайн) 3.16 Мб, 210с. скачать: (fb2) (исправленную)  читать: (полностью)  - Марк Твен

Общая статистика

Длина текста377873 знаков
Длина диалогов109729 знаков
Слов в произведении (СВП)60770 слов
Приблизительно страниц210 стр.
Средняя длина слова4.93 знаков
Предложений в произведении (ПВП)4999 предл.
Средняя длина предложения (СДП)72.86 знаков
Доля диалогов в тексте29.04 %
Доля авторского текста70.96 %
СДП диалогов76.11 знаков
СДП авторского текста117.08 знаков
Использование диалогов по тексту книги № 429625: Приключения Тома Сойера (Марк Твен)
Максимальный фрагмент авторского текста - 17581 знаков (в страницах - примерно 10, начинается где-то с 135 страницы)

Активный словарный запас

Использовано уникальных слов14731
Активный словарный запас (АСЗ)14636
Активный не словарный запас (АНСЗ)95
Удельный АСЗ на 3000 слов текста1473.30126108 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3856.61103483 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 429625: Приключения Тома Сойера (Марк Твен)
Максимальный УАСЗ-3000 (1702) наблюдается примерно на 128 странице
Минимальный УАСЗ-3000 (1233) наблюдается примерно на 114 странице
Рост АСЗ книги № 429625: Приключения Тома Сойера (Марк Твен)

Буквы и знаки препинания

Всего букв299582 букв
Всего знаков препинания13363 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 7123117.21
. 364960.05
- 67711.14
? 5519.07
! 80113.18
... 00.00
!.. 210.35
?.. 10.02
!!! 00.00
?! 80.13
" 00.00
() 00.00
: 4407.24
; 921.51
БукваКол-во (шт.)Частота использования (в %)
А236617.90
Б53221.78
В127174.24
Г56531.89
Д99753.33
Е-Ё247888.27
Ж56531.89
З50711.69
И-Й227347.59
К108683.63
Л151965.07
М96063.21
Н180836.04
О3461011.55
П85052.84
Р123594.13
С157855.27
Т193106.45
У92433.09
Ф2710.09
Х25730.86
Ц10220.34
Ч48291.61
Ш26590.89
Щ10130.34
Ь-Ъ66052.20
Ы52301.75
Э11400.38
Ю13620.45
Я63032.10
Диаграма использования букв книги № 429625: Приключения Тома Сойера (Марк Твен)

Части речи

Определенных частей речи (ОЧР)60764 слов
Не определенных частей речи (НОЧР)6 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.1421023.386
Глаг.661719.602
Мест.-сущ.661710.890
Предл.311610.095
Союз656711
Прилаг.31165.128
Нареч.38956.410
Местоим-прилаг.26864.420
Частица36185.954
Местоим. нареч.13842.278
Числит.3920.645
Числит-прилаг.1140.188
Междомет.1200.197
Часть комп.
сложн. слова
00.000

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.42.8750.4119.3228.8042.728.3814.558.1810.685.411.300.580.640.00
Глаг.36.1923.0421.6738.9526.0411.2112.908.1111.594.530.890.300.610.00
Мест.-сущ.12.0534.959.668.1610.994.159.594.1011.493.210.310.080.150.00
Предл.53.581.7618.070.741.7910.380.5311.540.160.021.680.610.080.00
Союз16.6223.7518.078.665.154.5911.035.179.614.590.580.160.100.00
Прилаг.36.272.531.221.504.512.530.860.580.640.350.200.000.100.00
Нареч.5.2823.026.675.276.602.905.461.565.531.200.430.050.130.00
Местоим-прилаг.19.395.153.552.531.713.922.441.662.400.970.380.070.030.00
Частица5.3524.876.504.584.431.664.112.473.801.480.210.020.070.00
Местоим. нареч.1.585.303.521.253.310.922.020.663.180.920.100.020.000.00
Числит.3.370.870.080.330.310.460.430.100.100.050.350.000.000.00
Числит-прилаг.1.000.210.080.080.100.070.050.050.180.020.030.000.000.00
Междомет.0.280.150.480.100.410.120.130.030.180.030.000.000.070.00
Часть комп.
сложн. слова
0.000.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.14.0118.4820.6720.3421.79
Глаг.11.5319.2222.5722.5222.50
Мест.-сущ.16.6917.1214.6213.0510.63
Предл.8.777.037.9810.5910.14
Союз17.458.358.068.6710.88
Прилаг.2.583.103.924.264.84
Нареч.9.218.436.906.496.11
Местоим-прилаг.3.644.694.274.334.16
Частица8.979.298.026.725.99
Местоим. нареч.4.623.122.132.042.08
Числит.0.640.760.460.680.63
Числит-прилаг.0.340.180.280.210.20
Междомет.1.560.230.110.090.05
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.23.8523.5623.7021.5124.24
Глаг.21.6018.9718.8820.3618.92
Мест.-сущ.9.459.889.089.759.32
Предл.10.1211.0610.5011.2912.51
Союз10.7611.6412.7410.8612.00
Прилаг.5.394.805.886.425.52
Нареч.5.786.266.145.415.05
Местоим-прилаг.4.675.114.924.274.55
Частица5.455.445.556.854.90
Местоим. нареч.2.112.311.752.292.21
Числит.0.670.640.500.680.62
Числит-прилаг.0.080.180.330.290.12
Междомет.0.060.150.030.040.04
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
1112131415
Сущ.22.4521.8922.4022.6523.53
Глаг.18.4919.6918.8717.7518.87
Мест.-сущ.9.489.498.139.978.32
Предл.12.5410.8012.9412.7312.17
Союз11.3511.4611.6111.2110.99
Прилаг.5.956.976.147.046.52
Нареч.5.955.855.885.976.15
Местоим-прилаг.5.195.054.304.564.66
Частица5.446.086.555.755.21
Местоим. нареч.2.081.962.151.632.61
Числит.0.810.510.870.450.81
Числит-прилаг.0.210.190.100.170.12
Междомет.0.040.050.050.110.06
Часть комп.
сложн. слова
0.000.000.000.000.00