Лингвистический анализ: Простаки за границей или Путь новых паломников (Марк Твен)


- Простаки за границей или Путь новых паломников (пер. Ирина Гавриловна Гурова, ...) (и.с. Собрание сочинений в 8 томах-1) 3.17 Мб, 607с. скачать: (fb2) (исправленную)  читать: (полностью)  - Марк Твен

Общая статистика

Длина текста1092048 знаков
Длина диалогов38506 знаков
Слов в произведении (СВП)170046 слов
Приблизительно страниц607 стр.
Средняя длина слова5.16 знаков
Предложений в произведении (ПВП)9838 предл.
Средняя длина предложения (СДП)108.11 знаков
Доля диалогов в тексте3.53 %
Доля авторского текста96.47 %
СДП диалогов59.07 знаков
СДП авторского текста116.65 знаков
Использование диалогов по тексту книги № 294478: Простаки за границей или Путь новых паломников (Марк Твен)
Максимальный фрагмент авторского текста - 94030 знаков (в страницах - примерно 52, начинается где-то с 388 страницы)

Активный словарный запас

Использовано уникальных слов39344
Активный словарный запас (АСЗ)34802
Активный не словарный запас (АНСЗ)4542
Удельный АСЗ на 3000 слов текста1700.87385141 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4668.5656560 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста27435.9152315 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 294478: Простаки за границей или Путь новых паломников (Марк Твен)
Максимальный УАСЗ-3000 (1899) наблюдается примерно на 592 странице
Минимальный УАСЗ-3000 (1510) наблюдается примерно на 421 странице
Рост АСЗ книги № 294478: Простаки за границей или Путь новых паломников (Марк Твен)

Буквы и знаки препинания

Всего букв876775 букв
Всего знаков препинания33163 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 19531114.86
. 877551.60
- 12637.43
? 3522.07
! 7964.68
... 3021.78
!.. 80.05
?.. 50.03
!!! 00.00
?! 00.00
" 00.00
() 3792.23
: 5373.16
; 12157.15
БукваКол-во (шт.)Частота использования (в %)
А681067.77
Б141931.62
В386224.41
Г161741.84
Д276903.16
Е-Ё741968.46
Ж161741.84
З143791.64
И-Й766628.74
К297623.39
Л392394.48
М299363.41
Н581016.63
О9464310.79
П240482.74
Р400454.57
С475025.42
Т527886.02
У221082.52
Ф17680.20
Х100751.15
Ц40200.46
Ч118251.35
Ш69640.79
Щ31500.36
Ь-Ъ160011.82
Ы206402.35
Э28920.33
Ю57140.65
Я177022.02
Диаграма использования букв книги № 294478: Простаки за границей или Путь новых паломников (Марк Твен)

Части речи

Определенных частей речи (ОЧР)168827 слов
Не определенных частей речи (НОЧР)1219 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.5019129.729
Глаг.1455715.576
Мест.-сущ.145578.622
Предл.1461110.861
Союз149809
Прилаг.146118.654
Нареч.80354.759
Местоим-прилаг.91895.443
Частица68394.051
Местоим. нареч.32191.907
Числит.20311.203
Числит-прилаг.3230.191
Междомет.1980.117
Часть комп.
сложн. слова
220.013

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.73.8745.3221.9939.5046.7421.8312.5815.749.706.452.440.590.480.05
Глаг.34.1514.5116.7435.0214.3112.508.298.106.913.191.630.230.170.01
Мест.-сущ.12.9229.973.646.876.155.677.672.757.742.180.540.070.040.00
Предл.51.153.8515.231.030.9415.550.8715.630.260.173.180.610.110.04
Союз17.9916.7213.288.843.676.326.655.096.063.150.760.120.080.00
Прилаг.60.413.431.733.496.177.331.331.050.710.410.360.020.070.02
Нареч.5.6214.593.844.644.524.663.451.613.160.790.630.050.020.01
Местоим-прилаг.24.325.943.963.311.477.562.101.842.171.140.500.100.030.01
Частица5.8816.563.193.681.602.602.461.911.360.870.370.010.020.00
Местоим. нареч.1.854.132.181.602.501.521.880.382.180.630.200.010.010.00
Числит.7.580.470.240.410.500.750.270.230.120.051.310.070.030.00
Числит-прилаг.1.090.140.120.140.070.140.020.020.110.010.050.010.000.00
Междомет.0.390.120.080.070.080.090.040.080.040.030.040.010.120.00
Часть комп.
сложн. слова
0.080.010.010.000.010.020.000.010.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.19.1624.0026.5729.1929.97
Глаг.7.1222.8919.6917.7616.87
Мест.-сущ.20.9411.5510.269.237.65
Предл.12.968.1411.2110.8210.85
Союз12.854.296.316.778.35
Прилаг.5.816.517.248.818.80
Нареч.6.656.455.335.134.70
Местоим-прилаг.5.966.225.075.095.54
Частица3.435.934.853.954.25
Местоим. нареч.3.312.181.821.661.54
Числит.0.941.281.391.231.17
Числит-прилаг.0.340.330.140.230.25
Междомет.0.510.210.100.110.06
Часть комп.
сложн. слова
0.000.020.010.020.01

Номер слова в предложении
678910
Сущ.30.5931.2131.1930.3229.20
Глаг.15.9914.9815.0915.2815.99
Мест.-сущ.7.476.897.167.187.02
Предл.11.3011.8610.6311.8810.97
Союз9.128.999.569.089.29
Прилаг.9.288.939.078.799.36
Нареч.3.924.154.164.154.19
Местоим-прилаг.5.595.395.205.446.46
Частица3.343.764.084.364.10
Местоим. нареч.1.721.831.971.871.73
Числит.1.341.671.441.351.46
Числит-прилаг.0.250.160.270.210.14
Междомет.0.110.170.120.050.10
Часть комп.
сложн. слова
0.000.010.050.020.00

Номер слова в предложении
1112131415
Сущ.30.3929.7228.8429.8930.05
Глаг.15.2314.8315.9114.0914.54
Мест.-сущ.7.258.307.957.877.88
Предл.11.5011.2611.9411.0111.39
Союз9.719.839.4110.9710.07
Прилаг.9.038.999.198.998.94
Нареч.4.304.424.524.334.45
Местоим-прилаг.5.535.315.345.495.04
Частица3.673.784.034.134.49
Местоим. нареч.1.791.961.601.891.88
Числит.1.371.381.051.191.01
Числит-прилаг.0.130.160.120.090.16
Междомет.0.070.080.060.070.07
Часть комп.
сложн. слова
0.020.000.020.000.02