Лингвистический анализ: Том 9. По экватору. Таинственный незнакомец (Марк Твен)


- Том 9. По экватору. Таинственный незнакомец (а.с. Марк Твен. Собрание сочинений в 12 томах -9) 2.39 Мб, 690с. скачать: (fb2) (исправленную)  читать: (полностью)  - Марк Твен

Общая статистика

Длина текста1240542 знаков
Длина диалогов111050 знаков
Слов в произведении (СВП)189625 слов
Приблизительно страниц690 стр.
Средняя длина слова5.28 знаков
Предложений в произведении (ПВП)11601 предл.
Средняя длина предложения (СДП)104.02 знаков
Доля диалогов в тексте8.95 %
Доля авторского текста91.05 %
СДП диалогов59.82 знаков
СДП авторского текста119.58 знаков
Использование диалогов по тексту книги № 169896: Том 9. По экватору. Таинственный незнакомец (Марк Твен)
Максимальный фрагмент авторского текста - 221266 знаков (в страницах - примерно 123, начинается где-то с 376 страницы)

Активный словарный запас

Использовано уникальных слов37459
Активный словарный запас (АСЗ)36355
Активный не словарный запас (АНСЗ)1104
Удельный АСЗ на 3000 слов текста1561.32403729 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4204.69350125 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста24376.3829357 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 169896: Том 9. По экватору. Таинственный незнакомец (Марк Твен)
Максимальный УАСЗ-3000 (1769) наблюдается примерно на 244 странице
Минимальный УАСЗ-3000 (1275) наблюдается примерно на 592 странице
Рост АСЗ книги № 169896: Том 9. По экватору. Таинственный незнакомец (Марк Твен)

Буквы и знаки препинания

Всего букв1000790 букв
Всего знаков препинания38508 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 22082116.45
. 1069356.39
- 16188.53
? 5793.05
! 5062.67
... 2041.08
!.. 40.02
?.. 20.01
!!! 00.00
?! 50.03
" 00.00
() 1450.76
: 9474.99
; 17239.09
БукваКол-во (шт.)Частота использования (в %)
А773097.72
Б176321.76
В444624.44
Г179401.79
Д325673.25
Е-Ё864088.63
Ж179401.79
З163651.64
И-Й858718.58
К318403.18
Л462864.62
М324323.24
Н674536.74
О10850510.84
П263542.63
Р432464.32
С545515.45
Т626036.26
У264312.64
Ф15860.16
Х99420.99
Ц41450.41
Ч150461.50
Ш73450.73
Щ35540.36
Ь-Ъ192071.92
Ы214702.15
Э35460.35
Ю64190.64
Я202982.03
Диаграма использования букв книги № 169896: Том 9. По экватору. Таинственный незнакомец (Марк Твен)

Части речи

Определенных частей речи (ОЧР)189434 слов
Не определенных частей речи (НОЧР)191 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.5112826.990
Глаг.1884416.729
Мест.-сущ.188449.948
Предл.1546810.290
Союз1802510
Прилаг.154688.165
Нареч.99525.254
Местоим-прилаг.102055.387
Частица84204.445
Местоим. нареч.33601.774
Числит.23531.242
Числит-прилаг.3770.199
Междомет.940.050
Часть комп.
сложн. слова
250.013

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.55.5046.4222.3637.2545.8118.1113.2213.748.955.302.440.580.170.04
Глаг.32.9615.9020.4133.4018.4212.5810.169.978.033.261.820.290.100.01
Мест.-сущ.13.4836.025.187.166.766.098.913.099.382.610.640.110.040.01
Предл.50.641.6417.680.370.9712.840.6514.020.130.113.250.520.020.05
Союз17.8018.9116.298.313.757.146.885.556.542.920.850.170.020.02
Прилаг.54.083.372.203.477.197.301.311.110.840.460.240.040.030.02
Нареч.4.2516.134.634.905.715.584.571.713.470.870.670.030.010.00
Местоим-прилаг.25.615.614.102.301.927.221.811.602.330.830.420.120.020.00
Частица5.1718.933.833.821.882.632.972.071.840.920.350.020.010.00
Местоим. нареч.1.493.732.431.152.161.261.690.602.730.390.080.020.020.00
Числит.7.560.390.230.610.420.740.290.310.080.041.640.100.000.00
Числит-прилаг.1.190.200.080.140.100.100.040.040.060.010.020.010.000.00
Междомет.0.080.040.040.010.070.030.040.050.040.020.000.000.080.00
Часть комп.
сложн. слова
0.090.000.000.000.000.040.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.18.8522.8723.6126.4627.12
Глаг.7.5024.4922.4719.6518.55
Мест.-сущ.20.9313.0210.9210.369.19
Предл.12.306.369.4510.5410.84
Союз13.654.686.797.328.88
Прилаг.5.045.896.808.248.45
Нареч.7.155.946.365.174.64
Местоим-прилаг.5.585.674.754.995.49
Частица4.237.145.584.324.06
Местоим. нареч.3.222.301.791.321.34
Числит.0.881.311.281.421.25
Числит-прилаг.0.350.260.210.190.17
Междомет.0.330.060.010.020.01
Часть комп.
сложн. слова
0.010.010.000.020.01

Номер слова в предложении
678910
Сущ.27.2626.8226.3926.6926.44
Глаг.16.3916.2416.5415.9416.03
Мест.-сущ.9.018.948.479.629.27
Предл.10.8310.8510.8411.0711.13
Союз10.5210.0410.4210.4810.98
Прилаг.8.328.718.638.668.33
Нареч.5.024.935.224.524.88
Местоим-прилаг.5.355.855.715.605.16
Частица4.014.524.364.214.52
Местоим. нареч.1.731.591.851.551.69
Числит.1.281.281.401.471.28
Числит-прилаг.0.220.170.150.160.23
Междомет.0.060.030.020.000.03
Часть комп.
сложн. слова
0.010.000.000.030.03

Номер слова в предложении
1112131415
Сущ.25.3626.5224.4926.7226.53
Глаг.16.2217.3416.2815.7815.64
Мест.-сущ.9.468.999.309.749.06
Предл.11.2310.2311.5311.0811.28
Союз10.8410.3911.259.8710.72
Прилаг.8.968.188.328.648.37
Нареч.4.845.154.984.985.31
Местоим-прилаг.5.595.346.135.665.50
Частица4.424.844.394.214.49
Местоим. нареч.1.571.481.721.921.48
Числит.1.291.321.411.171.33
Числит-прилаг.0.180.160.190.150.21
Междомет.0.030.030.000.040.06
Часть комп.
сложн. слова
0.000.030.000.040.02