Лингвистический анализ: Приключения Тома Сойера (Марк Твен)
Общая статистика
Длина текста | 377873 знаков |
Длина диалогов | 109729 знаков |
Слов в произведении (СВП) | 60770 слов |
Приблизительно страниц | 210 стр. |
Средняя длина слова | 4.93 знаков |
Предложений в произведении (ПВП) | 4999 предл. |
Средняя длина предложения (СДП) | 72.86 знаков |
Доля диалогов в тексте | 29.04 % |
Доля авторского текста | 70.96 % |
СДП диалогов | 76.11 знаков |
СДП авторского текста | 117.08 знаков |
|
Максимальный фрагмент авторского текста - 17581 знаков (в страницах - примерно 10, начинается где-то с 135 страницы) |
Активный словарный запас
Использовано уникальных слов | 14731 | |
Активный словарный запас (АСЗ) | 14636 | |
Активный не словарный запас (АНСЗ) | 95 | |
Удельный АСЗ на 3000 слов текста | 1473.30 | 126108 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3856.61 | 103483 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1702) наблюдается примерно на 128 странице |
Минимальный УАСЗ-3000 (1233) наблюдается примерно на 114 странице |
|
Буквы и знаки препинания
Всего букв | 299582 букв |
Всего знаков препинания | 13363 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 7123 | 117.21 |
. | 3649 | 60.05 |
- | 677 | 11.14 |
? | 551 | 9.07 |
! | 801 | 13.18 |
... | 0 | 0.00 |
!.. | 21 | 0.35 |
?.. | 1 | 0.02 |
!!! | 0 | 0.00 |
?! | 8 | 0.13 |
" | 0 | 0.00 |
() | 0 | 0.00 |
: | 440 | 7.24 |
; | 92 | 1.51 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 23661 | 7.90 |
Б | 5322 | 1.78 |
В | 12717 | 4.24 |
Г | 5653 | 1.89 |
Д | 9975 | 3.33 |
Е-Ё | 24788 | 8.27 |
Ж | 5653 | 1.89 |
З | 5071 | 1.69 |
И-Й | 22734 | 7.59 |
К | 10868 | 3.63 |
Л | 15196 | 5.07 |
М | 9606 | 3.21 |
Н | 18083 | 6.04 |
О | 34610 | 11.55 |
П | 8505 | 2.84 |
Р | 12359 | 4.13 |
С | 15785 | 5.27 |
Т | 19310 | 6.45 |
У | 9243 | 3.09 |
Ф | 271 | 0.09 |
Х | 2573 | 0.86 |
Ц | 1022 | 0.34 |
Ч | 4829 | 1.61 |
Ш | 2659 | 0.89 |
Щ | 1013 | 0.34 |
Ь-Ъ | 6605 | 2.20 |
Ы | 5230 | 1.75 |
Э | 1140 | 0.38 |
Ю | 1362 | 0.45 |
Я | 6303 | 2.10 |
|
Части речи
Определенных частей речи (ОЧР) | 60764 слов |
Не определенных частей речи (НОЧР) | 6 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 14210 | 23.386 |
Глаг. | 6617 | 19.602 |
Мест.-сущ. | 6617 | 10.890 |
Предл. | 3116 | 10.095 |
Союз | 6567 | 11 |
Прилаг. | 3116 | 5.128 |
Нареч. | 3895 | 6.410 |
Местоим-прилаг. | 2686 | 4.420 |
Частица | 3618 | 5.954 |
Местоим. нареч. | 1384 | 2.278 |
Числит. | 392 | 0.645 |
Числит-прилаг. | 114 | 0.188 |
Междомет. | 120 | 0.197 |
Часть комп. сложн. слова | 0 | 0.000 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 42.87 | 50.41 | 19.32 | 28.80 | 42.72 | 8.38 | 14.55 | 8.18 | 10.68 | 5.41 | 1.30 | 0.58 | 0.64 | 0.00 |
Глаг. | 36.19 | 23.04 | 21.67 | 38.95 | 26.04 | 11.21 | 12.90 | 8.11 | 11.59 | 4.53 | 0.89 | 0.30 | 0.61 | 0.00 |
Мест.-сущ. | 12.05 | 34.95 | 9.66 | 8.16 | 10.99 | 4.15 | 9.59 | 4.10 | 11.49 | 3.21 | 0.31 | 0.08 | 0.15 | 0.00 |
Предл. | 53.58 | 1.76 | 18.07 | 0.74 | 1.79 | 10.38 | 0.53 | 11.54 | 0.16 | 0.02 | 1.68 | 0.61 | 0.08 | 0.00 |
Союз | 16.62 | 23.75 | 18.07 | 8.66 | 5.15 | 4.59 | 11.03 | 5.17 | 9.61 | 4.59 | 0.58 | 0.16 | 0.10 | 0.00 |
Прилаг. | 36.27 | 2.53 | 1.22 | 1.50 | 4.51 | 2.53 | 0.86 | 0.58 | 0.64 | 0.35 | 0.20 | 0.00 | 0.10 | 0.00 |
Нареч. | 5.28 | 23.02 | 6.67 | 5.27 | 6.60 | 2.90 | 5.46 | 1.56 | 5.53 | 1.20 | 0.43 | 0.05 | 0.13 | 0.00 |
Местоим-прилаг. | 19.39 | 5.15 | 3.55 | 2.53 | 1.71 | 3.92 | 2.44 | 1.66 | 2.40 | 0.97 | 0.38 | 0.07 | 0.03 | 0.00 |
Частица | 5.35 | 24.87 | 6.50 | 4.58 | 4.43 | 1.66 | 4.11 | 2.47 | 3.80 | 1.48 | 0.21 | 0.02 | 0.07 | 0.00 |
Местоим. нареч. | 1.58 | 5.30 | 3.52 | 1.25 | 3.31 | 0.92 | 2.02 | 0.66 | 3.18 | 0.92 | 0.10 | 0.02 | 0.00 | 0.00 |
Числит. | 3.37 | 0.87 | 0.08 | 0.33 | 0.31 | 0.46 | 0.43 | 0.10 | 0.10 | 0.05 | 0.35 | 0.00 | 0.00 | 0.00 |
Числит-прилаг. | 1.00 | 0.21 | 0.08 | 0.08 | 0.10 | 0.07 | 0.05 | 0.05 | 0.18 | 0.02 | 0.03 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.28 | 0.15 | 0.48 | 0.10 | 0.41 | 0.12 | 0.13 | 0.03 | 0.18 | 0.03 | 0.00 | 0.00 | 0.07 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 14.01 | 18.48 | 20.67 | 20.34 | 21.79 |
Глаг. | 11.53 | 19.22 | 22.57 | 22.52 | 22.50 |
Мест.-сущ. | 16.69 | 17.12 | 14.62 | 13.05 | 10.63 |
Предл. | 8.77 | 7.03 | 7.98 | 10.59 | 10.14 |
Союз | 17.45 | 8.35 | 8.06 | 8.67 | 10.88 |
Прилаг. | 2.58 | 3.10 | 3.92 | 4.26 | 4.84 |
Нареч. | 9.21 | 8.43 | 6.90 | 6.49 | 6.11 |
Местоим-прилаг. | 3.64 | 4.69 | 4.27 | 4.33 | 4.16 |
Частица | 8.97 | 9.29 | 8.02 | 6.72 | 5.99 |
Местоим. нареч. | 4.62 | 3.12 | 2.13 | 2.04 | 2.08 |
Числит. | 0.64 | 0.76 | 0.46 | 0.68 | 0.63 |
Числит-прилаг. | 0.34 | 0.18 | 0.28 | 0.21 | 0.20 |
Междомет. | 1.56 | 0.23 | 0.11 | 0.09 | 0.05 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 23.85 | 23.56 | 23.70 | 21.51 | 24.24 |
Глаг. | 21.60 | 18.97 | 18.88 | 20.36 | 18.92 |
Мест.-сущ. | 9.45 | 9.88 | 9.08 | 9.75 | 9.32 |
Предл. | 10.12 | 11.06 | 10.50 | 11.29 | 12.51 |
Союз | 10.76 | 11.64 | 12.74 | 10.86 | 12.00 |
Прилаг. | 5.39 | 4.80 | 5.88 | 6.42 | 5.52 |
Нареч. | 5.78 | 6.26 | 6.14 | 5.41 | 5.05 |
Местоим-прилаг. | 4.67 | 5.11 | 4.92 | 4.27 | 4.55 |
Частица | 5.45 | 5.44 | 5.55 | 6.85 | 4.90 |
Местоим. нареч. | 2.11 | 2.31 | 1.75 | 2.29 | 2.21 |
Числит. | 0.67 | 0.64 | 0.50 | 0.68 | 0.62 |
Числит-прилаг. | 0.08 | 0.18 | 0.33 | 0.29 | 0.12 |
Междомет. | 0.06 | 0.15 | 0.03 | 0.04 | 0.04 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 22.45 | 21.89 | 22.40 | 22.65 | 23.53 |
Глаг. | 18.49 | 19.69 | 18.87 | 17.75 | 18.87 |
Мест.-сущ. | 9.48 | 9.49 | 8.13 | 9.97 | 8.32 |
Предл. | 12.54 | 10.80 | 12.94 | 12.73 | 12.17 |
Союз | 11.35 | 11.46 | 11.61 | 11.21 | 10.99 |
Прилаг. | 5.95 | 6.97 | 6.14 | 7.04 | 6.52 |
Нареч. | 5.95 | 5.85 | 5.88 | 5.97 | 6.15 |
Местоим-прилаг. | 5.19 | 5.05 | 4.30 | 4.56 | 4.66 |
Частица | 5.44 | 6.08 | 6.55 | 5.75 | 5.21 |
Местоим. нареч. | 2.08 | 1.96 | 2.15 | 1.63 | 2.61 |
Числит. | 0.81 | 0.51 | 0.87 | 0.45 | 0.81 |
Числит-прилаг. | 0.21 | 0.19 | 0.10 | 0.17 | 0.12 |
Междомет. | 0.04 | 0.05 | 0.05 | 0.11 | 0.06 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Последние комментарии
11 минут 38 секунд назад
16 часов 15 минут назад
1 день 1 час назад
1 день 1 час назад
3 дней 7 часов назад
3 дней 11 часов назад