Лингвистический анализ: Том 3 (Марк Твен)
Общая статистика
Длина текста | 956782 знаков |
Длина диалогов | 269871 знаков |
Слов в произведении (СВП) | 146617 слов |
Приблизительно страниц | 532 стр. |
Средняя длина слова | 5.24 знаков |
Предложений в произведении (ПВП) | 9330 предл. |
Средняя длина предложения (СДП) | 99.75 знаков |
Доля диалогов в тексте | 28.21 % |
Доля авторского текста | 71.79 % |
СДП диалогов | 98.84 знаков |
СДП авторского текста | 131.91 знаков |
|
Максимальный фрагмент авторского текста - 31631 знаков (в страницах - примерно 18, начинается где-то с 536 страницы) |
Активный словарный запас
Использовано уникальных слов | 29666 | |
Активный словарный запас (АСЗ) | 27965 | |
Активный не словарный запас (АНСЗ) | 1701 | |
Удельный АСЗ на 3000 слов текста | 1527.97 | 126108 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4076.92 | 103483 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 22941.39 | 66274 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1768) наблюдается примерно на 511 странице |
Минимальный УАСЗ-3000 (1241) наблюдается примерно на 330 странице |
|
Буквы и знаки препинания
Всего букв | 760593 букв |
Всего знаков препинания | 30994 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 17149 | 116.96 |
. | 7912 | 53.96 |
- | 1544 | 10.53 |
? | 1002 | 6.83 |
! | 1140 | 7.78 |
... | 0 | 0.00 |
!.. | 9 | 0.06 |
?.. | 4 | 0.03 |
!!! | 4 | 0.03 |
?! | 9 | 0.06 |
" | 44 | 0.30 |
() | 314 | 2.14 |
: | 824 | 5.62 |
; | 1039 | 7.09 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 59335 | 7.80 |
Б | 13072 | 1.72 |
В | 33032 | 4.34 |
Г | 14369 | 1.89 |
Д | 24413 | 3.21 |
Е-Ё | 66804 | 8.78 |
Ж | 14369 | 1.89 |
З | 12422 | 1.63 |
И-Й | 61657 | 8.11 |
К | 24169 | 3.18 |
Л | 36546 | 4.80 |
М | 23544 | 3.10 |
Н | 50959 | 6.70 |
О | 85261 | 11.21 |
П | 21465 | 2.82 |
Р | 32971 | 4.33 |
С | 42060 | 5.53 |
Т | 47084 | 6.19 |
У | 20953 | 2.75 |
Ф | 1644 | 0.22 |
Х | 6838 | 0.90 |
Ц | 2427 | 0.32 |
Ч | 11468 | 1.51 |
Ш | 6152 | 0.81 |
Щ | 2513 | 0.33 |
Ь-Ъ | 15458 | 2.03 |
Ы | 14097 | 1.85 |
Э | 2640 | 0.35 |
Ю | 4365 | 0.57 |
Я | 14810 | 1.95 |
|
Части речи
Определенных частей речи (ОЧР) | 145023 слов |
Не определенных частей речи (НОЧР) | 1594 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 37900 | 26.134 |
Глаг. | 14824 | 17.317 |
Мест.-сущ. | 14824 | 10.222 |
Предл. | 10474 | 10.018 |
Союз | 14079 | 10 |
Прилаг. | 10474 | 7.222 |
Нареч. | 8416 | 5.803 |
Местоим-прилаг. | 7763 | 5.353 |
Частица | 7692 | 5.304 |
Местоим. нареч. | 2726 | 1.880 |
Числит. | 1124 | 0.775 |
Числит-прилаг. | 228 | 0.157 |
Междомет. | 147 | 0.101 |
Часть комп. сложн. слова | 9 | 0.006 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 55.85 | 48.01 | 19.02 | 34.71 | 44.05 | 14.43 | 14.23 | 12.07 | 11.18 | 5.13 | 1.70 | 0.49 | 0.45 | 0.01 |
Глаг. | 35.31 | 18.65 | 21.70 | 34.04 | 19.38 | 11.25 | 9.50 | 9.75 | 9.16 | 3.01 | 1.11 | 0.15 | 0.14 | 0.01 |
Мест.-сущ. | 14.34 | 30.87 | 6.35 | 7.60 | 8.22 | 6.39 | 10.37 | 4.07 | 10.33 | 3.09 | 0.46 | 0.06 | 0.06 | 0.00 |
Предл. | 47.96 | 1.86 | 18.34 | 0.52 | 1.10 | 12.74 | 0.76 | 14.30 | 0.23 | 0.14 | 1.50 | 0.62 | 0.07 | 0.03 |
Союз | 16.64 | 18.47 | 16.29 | 7.97 | 5.36 | 5.73 | 9.00 | 5.29 | 8.20 | 3.39 | 0.59 | 0.10 | 0.05 | 0.01 |
Прилаг. | 49.14 | 3.42 | 2.12 | 2.72 | 5.96 | 5.21 | 1.05 | 0.97 | 0.96 | 0.41 | 0.17 | 0.01 | 0.06 | 0.01 |
Нареч. | 4.92 | 20.17 | 5.00 | 4.42 | 5.50 | 5.25 | 4.93 | 1.72 | 4.74 | 0.81 | 0.51 | 0.04 | 0.02 | 0.00 |
Местоим-прилаг. | 24.42 | 5.52 | 4.51 | 2.34 | 2.05 | 6.33 | 2.22 | 2.08 | 2.44 | 1.21 | 0.34 | 0.05 | 0.03 | 0.00 |
Частица | 5.56 | 21.66 | 6.02 | 4.13 | 2.68 | 2.63 | 3.81 | 2.50 | 2.62 | 1.12 | 0.28 | 0.03 | 0.01 | 0.00 |
Местоим. нареч. | 1.41 | 3.92 | 2.48 | 1.33 | 2.17 | 1.53 | 1.93 | 0.53 | 2.94 | 0.45 | 0.10 | 0.00 | 0.01 | 0.00 |
Числит. | 4.45 | 0.41 | 0.25 | 0.26 | 0.46 | 0.50 | 0.18 | 0.14 | 0.09 | 0.03 | 0.94 | 0.02 | 0.01 | 0.00 |
Числит-прилаг. | 1.03 | 0.12 | 0.06 | 0.06 | 0.04 | 0.13 | 0.00 | 0.01 | 0.10 | 0.00 | 0.03 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.24 | 0.10 | 0.08 | 0.06 | 0.12 | 0.07 | 0.06 | 0.10 | 0.04 | 0.01 | 0.01 | 0.00 | 0.11 | 0.00 |
Часть комп. сложн. слова | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 19.78 | 21.64 | 22.08 | 25.16 | 25.75 |
Глаг. | 9.22 | 21.05 | 22.89 | 20.94 | 19.21 |
Мест.-сущ. | 16.06 | 14.19 | 11.58 | 10.93 | 9.82 |
Предл. | 10.69 | 6.23 | 9.02 | 9.91 | 10.39 |
Союз | 17.69 | 5.92 | 6.45 | 7.37 | 8.93 |
Прилаг. | 3.23 | 4.89 | 6.08 | 6.60 | 7.49 |
Нареч. | 6.74 | 7.57 | 7.25 | 6.52 | 5.49 |
Местоим-прилаг. | 4.27 | 5.66 | 4.77 | 4.76 | 5.18 |
Частица | 7.48 | 8.91 | 7.02 | 5.31 | 5.25 |
Местоим. нареч. | 3.15 | 2.61 | 1.63 | 1.65 | 1.63 |
Числит. | 0.69 | 0.76 | 0.86 | 0.67 | 0.66 |
Числит-прилаг. | 0.23 | 0.35 | 0.19 | 0.16 | 0.08 |
Междомет. | 0.75 | 0.22 | 0.16 | 0.03 | 0.09 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.02 | 0.00 | 0.01 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 25.91 | 27.00 | 27.01 | 25.93 | 25.36 |
Глаг. | 18.28 | 16.46 | 17.23 | 17.75 | 16.68 |
Мест.-сущ. | 9.61 | 9.45 | 9.16 | 10.08 | 8.93 |
Предл. | 10.67 | 10.55 | 10.31 | 10.49 | 10.86 |
Союз | 10.08 | 10.43 | 10.36 | 9.98 | 10.90 |
Прилаг. | 7.80 | 7.17 | 7.38 | 7.52 | 7.63 |
Нареч. | 5.46 | 5.64 | 5.00 | 5.56 | 5.57 |
Местоим-прилаг. | 4.88 | 5.58 | 5.95 | 5.25 | 5.88 |
Частица | 4.48 | 4.95 | 4.83 | 4.87 | 5.08 |
Местоим. нареч. | 1.80 | 1.66 | 1.82 | 1.87 | 2.04 |
Числит. | 0.80 | 0.92 | 0.84 | 0.58 | 0.88 |
Числит-прилаг. | 0.14 | 0.12 | 0.12 | 0.05 | 0.15 |
Междомет. | 0.07 | 0.08 | 0.02 | 0.05 | 0.04 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 25.89 | 25.26 | 26.02 | 24.70 | 25.97 |
Глаг. | 16.40 | 16.87 | 16.89 | 16.13 | 16.21 |
Мест.-сущ. | 9.49 | 10.16 | 9.92 | 9.77 | 9.60 |
Предл. | 10.93 | 11.46 | 10.18 | 10.72 | 11.26 |
Союз | 10.09 | 10.38 | 10.59 | 11.15 | 9.92 |
Прилаг. | 7.87 | 7.58 | 7.61 | 8.09 | 7.71 |
Нареч. | 5.40 | 4.96 | 5.30 | 5.51 | 5.33 |
Местоим-прилаг. | 5.67 | 5.31 | 6.18 | 6.07 | 5.74 |
Частица | 5.47 | 5.18 | 4.38 | 5.00 | 5.19 |
Местоим. нареч. | 1.71 | 1.72 | 1.90 | 1.91 | 1.97 |
Числит. | 0.95 | 0.99 | 0.81 | 0.74 | 0.98 |
Числит-прилаг. | 0.10 | 0.09 | 0.12 | 0.18 | 0.11 |
Междомет. | 0.02 | 0.02 | 0.07 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.02 | 0.03 | 0.00 |
Последние комментарии
1 час 50 минут назад
17 часов 54 минут назад
1 день 2 часов назад
1 день 2 часов назад
3 дней 9 часов назад
3 дней 13 часов назад