Лингвистический анализ: Приключения Тома Сойера (Марк Твен)


- Приключения Тома Сойера 725 Кб, 222с. скачать: (fb2) (исправленную)  читать: (полностью)  - Марк Твен

Общая статистика

Длина текста399413 знаков
Длина диалогов118294 знаков
Слов в произведении (СВП)63698 слов
Приблизительно страниц222 стр.
Средняя длина слова4.96 знаков
Предложений в произведении (ПВП)4900 предл.
Средняя длина предложения (СДП)78.74 знаков
Доля диалогов в тексте29.62 %
Доля авторского текста70.38 %
СДП диалогов73.26 знаков
СДП авторского текста125.55 знаков
Использование диалогов по тексту книги № 212351: Приключения Тома Сойера (Марк Твен)
Максимальный фрагмент авторского текста - 20164 знаков (в страницах - примерно 11, начинается где-то с 143 страницы)

Активный словарный запас

Использовано уникальных слов15871
Активный словарный запас (АСЗ)15660
Активный не словарный запас (АНСЗ)211
Удельный АСЗ на 3000 слов текста1477.89426873 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3915.50361500 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 212351: Приключения Тома Сойера (Марк Твен)
Максимальный УАСЗ-3000 (1720) наблюдается примерно на 132 странице
Минимальный УАСЗ-3000 (1254) наблюдается примерно на 118 странице
Рост АСЗ книги № 212351: Приключения Тома Сойера (Марк Твен)

Буквы и знаки препинания

Всего букв315594 букв
Всего знаков препинания14779 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 8662135.99
. 382960.11
- 6219.75
? 5178.12
! 6279.84
... 40.06
!.. 40.06
?.. 00.00
!!! 00.00
?! 20.03
" 00.00
() 280.44
: 3425.37
; 1432.24
БукваКол-во (шт.)Частота использования (в %)
А248807.88
Б54331.72
В131834.18
Г59301.88
Д105283.34
Е-Ё264068.37
Ж59301.88
З51821.64
И-Й252588.00
К113933.61
Л157184.98
М106363.37
Н191606.07
О3612811.45
П92352.93
Р127854.05
С164775.22
Т198286.28
У95023.01
Ф2680.08
Х27240.86
Ц11020.35
Ч49071.55
Ш31350.99
Щ10990.35
Ь-Ъ66992.12
Ы54601.73
Э10250.32
Ю15400.49
Я66222.10
Диаграма использования букв книги № 212351: Приключения Тома Сойера (Марк Твен)

Части речи

Определенных частей речи (ОЧР)63602 слов
Не определенных частей речи (НОЧР)96 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.1486523.372
Глаг.753319.613
Мест.-сущ.753311.844
Предл.35709.787
Союз668611
Прилаг.35705.613
Нареч.36305.707
Местоим-прилаг.28174.429
Частица38005.975
Местоим. нареч.13392.105
Числит.4190.659
Числит-прилаг.1020.160
Междомет.1350.212
Часть комп.
сложн. слова
70.011

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.46.4552.7020.6925.4938.4611.9511.3210.209.734.011.650.410.580.06
Глаг.34.3922.8026.3038.7925.749.7312.068.1012.314.150.830.300.610.02
Мест.-сущ.15.6835.8510.699.3211.514.879.284.0413.023.510.360.110.200.00
Предл.48.542.5520.390.631.4210.460.5510.850.240.081.600.490.080.02
Союз16.1524.4218.278.164.764.019.984.269.624.510.690.160.130.00
Прилаг.37.283.361.751.974.703.760.990.610.880.420.270.030.110.00
Нареч.5.5218.575.494.547.093.464.671.784.581.020.280.000.060.02
Местоим-прилаг.18.035.554.263.292.044.141.891.302.630.770.310.050.030.00
Частица5.4124.986.643.964.802.004.102.443.711.420.200.030.060.00
Местоим. нареч.1.574.213.221.163.551.041.920.572.581.120.050.020.050.00
Числит.3.430.820.270.330.440.570.240.060.130.000.310.000.000.00
Числит-прилаг.0.740.170.060.160.170.090.000.020.160.000.020.020.000.00
Междомет.0.420.140.410.080.440.060.080.060.170.050.000.000.200.00
Часть комп.
сложн. слова
0.110.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.16.2218.4521.5921.5923.82
Глаг.10.7422.6121.4722.5121.91
Мест.-сущ.16.9515.5015.7113.9912.05
Предл.7.176.7310.2210.1510.05
Союз20.886.936.617.249.12
Прилаг.3.743.083.464.955.13
Нареч.6.637.356.185.335.91
Местоим-прилаг.3.284.564.394.483.83
Частица9.0310.437.146.595.27
Местоим. нареч.2.633.412.172.192.25
Числит.0.960.530.740.540.39
Числит-прилаг.0.250.160.210.280.17
Междомет.1.510.240.100.130.08
Часть комп.
сложн. слова
0.000.020.000.030.00

Номер слова в предложении
678910
Сущ.23.9325.2422.6824.4523.65
Глаг.19.7019.2520.5519.5519.02
Мест.-сущ.11.019.5211.3610.8011.24
Предл.11.0410.3410.6910.0210.21
Союз9.9311.1311.8511.7510.70
Прилаг.6.125.725.596.236.16
Нареч.5.535.825.065.035.44
Местоим-прилаг.4.274.114.274.414.36
Частица5.845.925.104.666.34
Местоим. нареч.1.952.021.912.142.20
Числит.0.590.680.790.740.58
Числит-прилаг.0.000.170.110.080.00
Междомет.0.090.070.040.080.09
Часть комп.
сложн. слова
0.000.000.000.040.00

Номер слова в предложении
1112131415
Сущ.23.2823.8625.0323.2623.55
Глаг.21.4318.1717.4419.3417.17
Мест.-сущ.9.4710.2610.8310.819.49
Предл.11.4212.0111.599.8011.15
Союз11.0310.8911.3611.8813.02
Прилаг.6.157.126.956.706.16
Нареч.4.545.535.045.184.85
Местоим-прилаг.4.544.254.065.065.47
Частица5.424.895.044.875.82
Местоим. нареч.2.102.131.392.022.01
Числит.0.440.480.810.821.04
Числит-прилаг.0.150.270.120.190.21
Междомет.0.050.160.290.000.07
Часть комп.
сложн. слова
0.000.000.060.060.00