Лингвистический анализ: Том 10. (Марк Твен)
Общая статистика
Длина текста | 1194194 знаков |
Длина диалогов | 225582 знаков |
Слов в произведении (СВП) | 183578 слов |
Приблизительно страниц | 664 стр. |
Средняя длина слова | 5.22 знаков |
Предложений в произведении (ПВП) | 12047 предл. |
Средняя длина предложения (СДП) | 96.31 знаков |
Доля диалогов в тексте | 18.89 % |
Доля авторского текста | 81.11 % |
СДП диалогов | 96.65 знаков |
СДП авторского текста | 124.04 знаков |
|
Максимальный фрагмент авторского текста - 86013 знаков (в страницах - примерно 48, начинается где-то с 615 страницы) |
Активный словарный запас
Использовано уникальных слов | 36767 | |
Активный словарный запас (АСЗ) | 35775 | |
Активный не словарный запас (АНСЗ) | 992 | |
Удельный АСЗ на 3000 слов текста | 1520.43 | 403729 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4115.68 | 350125 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 24256.47 | 29357 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1758) наблюдается примерно на 257 странице |
Минимальный УАСЗ-3000 (1208) наблюдается примерно на 477 странице |
|
Буквы и знаки препинания
Всего букв | 956772 букв |
Всего знаков препинания | 38753 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 21742 | 118.43 |
. | 10135 | 55.21 |
- | 1995 | 10.87 |
? | 979 | 5.33 |
! | 1446 | 7.88 |
... | 5 | 0.03 |
!.. | 26 | 0.14 |
?.. | 6 | 0.03 |
!!! | 0 | 0.00 |
?! | 21 | 0.11 |
" | 1 | 0.01 |
() | 382 | 2.08 |
: | 1170 | 6.37 |
; | 845 | 4.60 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 73210 | 7.65 |
Б | 16068 | 1.68 |
В | 42292 | 4.42 |
Г | 17003 | 1.78 |
Д | 30812 | 3.22 |
Е-Ё | 82796 | 8.65 |
Ж | 17003 | 1.78 |
З | 16065 | 1.68 |
И-Й | 77450 | 8.09 |
К | 31291 | 3.27 |
Л | 44352 | 4.64 |
М | 31911 | 3.34 |
Н | 62751 | 6.56 |
О | 106422 | 11.12 |
П | 26524 | 2.77 |
Р | 41214 | 4.31 |
С | 52077 | 5.44 |
Т | 60660 | 6.34 |
У | 25747 | 2.69 |
Ф | 1416 | 0.15 |
Х | 8669 | 0.91 |
Ц | 3768 | 0.39 |
Ч | 14967 | 1.56 |
Ш | 7806 | 0.82 |
Щ | 3190 | 0.33 |
Ь-Ъ | 18987 | 1.98 |
Ы | 18605 | 1.94 |
Э | 3779 | 0.39 |
Ю | 6155 | 0.64 |
Я | 21215 | 2.22 |
|
Части речи
Определенных частей речи (ОЧР) | 183285 слов |
Не определенных частей речи (НОЧР) | 293 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 46058 | 25.129 |
Глаг. | 20200 | 17.651 |
Мест.-сущ. | 20200 | 11.021 |
Предл. | 13374 | 10.080 |
Союз | 17683 | 10 |
Прилаг. | 13374 | 7.297 |
Нареч. | 9666 | 5.274 |
Местоим-прилаг. | 10830 | 5.909 |
Частица | 8808 | 4.806 |
Местоим. нареч. | 3234 | 1.764 |
Числит. | 1871 | 1.021 |
Числит-прилаг. | 465 | 0.254 |
Междомет. | 243 | 0.133 |
Часть комп. сложн. слова | 26 | 0.014 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 49.91 | 42.71 | 22.69 | 34.37 | 42.93 | 14.84 | 11.84 | 14.03 | 9.87 | 4.78 | 2.04 | 0.69 | 0.52 | 0.06 |
Глаг. | 31.02 | 19.07 | 23.65 | 34.49 | 20.91 | 11.88 | 10.50 | 11.21 | 8.46 | 3.34 | 1.43 | 0.29 | 0.23 | 0.02 |
Мест.-сущ. | 13.06 | 39.80 | 6.68 | 8.27 | 7.64 | 6.52 | 10.24 | 4.08 | 10.40 | 2.80 | 0.59 | 0.05 | 0.08 | 0.00 |
Предл. | 47.42 | 1.56 | 18.57 | 0.49 | 1.16 | 12.36 | 0.46 | 15.16 | 0.14 | 0.15 | 2.38 | 0.85 | 0.08 | 0.03 |
Союз | 13.66 | 20.86 | 18.65 | 7.65 | 4.51 | 5.59 | 7.89 | 6.00 | 7.43 | 3.14 | 0.85 | 0.16 | 0.08 | 0.02 |
Прилаг. | 50.33 | 3.54 | 1.92 | 2.50 | 5.92 | 5.37 | 0.86 | 1.06 | 0.84 | 0.32 | 0.28 | 0.01 | 0.03 | 0.00 |
Нареч. | 3.96 | 17.92 | 5.52 | 4.69 | 5.40 | 4.21 | 4.09 | 1.91 | 3.53 | 0.78 | 0.61 | 0.07 | 0.06 | 0.01 |
Местоим-прилаг. | 28.34 | 5.72 | 4.25 | 2.85 | 2.07 | 8.04 | 1.73 | 2.25 | 2.34 | 0.89 | 0.44 | 0.15 | 0.03 | 0.00 |
Частица | 4.63 | 21.03 | 4.95 | 3.80 | 2.21 | 2.12 | 3.02 | 2.46 | 2.45 | 1.03 | 0.31 | 0.04 | 0.02 | 0.00 |
Местоим. нареч. | 1.06 | 3.57 | 2.78 | 1.05 | 2.95 | 1.13 | 1.83 | 0.51 | 2.30 | 0.31 | 0.10 | 0.02 | 0.02 | 0.00 |
Числит. | 5.94 | 0.52 | 0.25 | 0.37 | 0.52 | 0.72 | 0.19 | 0.20 | 0.09 | 0.04 | 1.16 | 0.19 | 0.01 | 0.00 |
Числит-прилаг. | 1.68 | 0.11 | 0.10 | 0.16 | 0.13 | 0.08 | 0.04 | 0.07 | 0.11 | 0.02 | 0.02 | 0.02 | 0.00 | 0.00 |
Междомет. | 0.20 | 0.11 | 0.19 | 0.09 | 0.14 | 0.07 | 0.06 | 0.16 | 0.09 | 0.04 | 0.00 | 0.00 | 0.19 | 0.00 |
Часть комп. сложн. слова | 0.08 | 0.00 | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 14.26 | 19.73 | 21.70 | 22.48 | 23.87 |
Глаг. | 10.04 | 23.28 | 22.25 | 20.56 | 19.92 |
Мест.-сущ. | 21.94 | 15.75 | 13.46 | 12.29 | 10.48 |
Предл. | 10.77 | 7.14 | 8.76 | 9.65 | 10.39 |
Союз | 15.88 | 4.99 | 6.81 | 8.11 | 9.03 |
Прилаг. | 3.87 | 5.09 | 6.33 | 7.22 | 7.62 |
Нареч. | 7.33 | 6.73 | 6.13 | 5.58 | 5.15 |
Местоим-прилаг. | 4.85 | 6.21 | 5.44 | 6.14 | 6.05 |
Частица | 5.91 | 7.43 | 5.53 | 5.04 | 4.49 |
Местоим. нареч. | 3.26 | 2.12 | 1.90 | 1.49 | 1.54 |
Числит. | 0.90 | 0.75 | 1.04 | 1.03 | 1.09 |
Числит-прилаг. | 0.21 | 0.49 | 0.30 | 0.30 | 0.30 |
Междомет. | 0.77 | 0.27 | 0.32 | 0.09 | 0.07 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.03 | 0.03 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 25.78 | 26.12 | 25.86 | 25.37 | 25.64 |
Глаг. | 18.13 | 17.20 | 17.76 | 16.78 | 17.16 |
Мест.-сущ. | 9.64 | 10.11 | 9.14 | 9.55 | 9.22 |
Предл. | 10.60 | 10.38 | 10.86 | 11.51 | 10.58 |
Союз | 9.45 | 10.30 | 10.20 | 10.53 | 9.95 |
Прилаг. | 8.29 | 7.58 | 7.83 | 7.91 | 8.48 |
Нареч. | 4.79 | 4.98 | 4.94 | 4.84 | 5.16 |
Местоим-прилаг. | 6.11 | 5.82 | 6.28 | 6.49 | 6.16 |
Частица | 4.31 | 4.33 | 4.04 | 4.49 | 4.83 |
Местоим. нареч. | 1.64 | 1.65 | 1.63 | 1.40 | 1.25 |
Числит. | 0.95 | 1.08 | 1.09 | 0.80 | 1.15 |
Числит-прилаг. | 0.24 | 0.29 | 0.26 | 0.22 | 0.30 |
Междомет. | 0.05 | 0.15 | 0.05 | 0.07 | 0.11 |
Часть комп. сложн. слова | 0.02 | 0.01 | 0.05 | 0.04 | 0.02 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 25.51 | 24.92 | 25.08 | 26.53 | 24.96 |
Глаг. | 17.53 | 16.72 | 16.87 | 16.85 | 16.98 |
Мест.-сущ. | 9.69 | 9.86 | 9.63 | 9.57 | 9.96 |
Предл. | 10.51 | 11.39 | 10.77 | 11.02 | 10.81 |
Союз | 10.66 | 10.61 | 10.39 | 10.34 | 10.09 |
Прилаг. | 7.26 | 7.69 | 8.73 | 7.69 | 8.08 |
Нареч. | 4.75 | 4.35 | 4.39 | 4.49 | 5.02 |
Местоим-прилаг. | 6.46 | 6.61 | 6.09 | 6.14 | 6.30 |
Частица | 4.45 | 4.19 | 4.98 | 4.47 | 4.52 |
Местоим. нареч. | 1.78 | 1.99 | 1.53 | 1.55 | 2.09 |
Числит. | 1.13 | 1.38 | 1.26 | 1.06 | 0.90 |
Числит-прилаг. | 0.21 | 0.21 | 0.25 | 0.18 | 0.20 |
Междомет. | 0.02 | 0.03 | 0.04 | 0.08 | 0.09 |
Часть комп. сложн. слова | 0.05 | 0.03 | 0.00 | 0.02 | 0.00 |
Последние комментарии
2 часов 7 минут назад
7 часов 51 минут назад
8 часов 58 минут назад
9 часов 56 минут назад
10 часов 11 минут назад
19 часов 21 минут назад