Лингвистический анализ: Том 2. Налегке (Марк Твен)
Общая статистика
Длина текста | 934491 знаков |
Длина диалогов | 85608 знаков |
Слов в произведении (СВП) | 143111 слов |
Приблизительно страниц | 520 стр. |
Средняя длина слова | 5.27 знаков |
Предложений в произведении (ПВП) | 7606 предл. |
Средняя длина предложения (СДП) | 120.02 знаков |
Доля диалогов в тексте | 9.16 % |
Доля авторского текста | 90.84 % |
СДП диалогов | 111.20 знаков |
СДП авторского текста | 133.97 знаков |
|
Максимальный фрагмент авторского текста - 46250 знаков (в страницах - примерно 26, начинается где-то с 89 страницы) |
Активный словарный запас
Использовано уникальных слов | 31934 | |
Активный словарный запас (АСЗ) | 31266 | |
Активный не словарный запас (АНСЗ) | 668 | |
Удельный АСЗ на 3000 слов текста | 1600.80 | 397522 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4333.93 | 355167 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 25063.98 | 57774 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1750) наблюдается примерно на 392 странице |
Минимальный УАСЗ-3000 (1380) наблюдается примерно на 490 странице |
|
Буквы и знаки препинания
Всего букв | 754139 букв |
Всего знаков препинания | 28566 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 17080 | 119.35 |
. | 7082 | 49.49 |
- | 1340 | 9.36 |
? | 407 | 2.84 |
! | 910 | 6.36 |
... | 0 | 0.00 |
!.. | 7 | 0.05 |
?.. | 1 | 0.01 |
!!! | 0 | 0.00 |
?! | 5 | 0.03 |
" | 0 | 0.00 |
() | 275 | 1.92 |
: | 524 | 3.66 |
; | 935 | 6.53 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 57612 | 7.64 |
Б | 12953 | 1.72 |
В | 33646 | 4.46 |
Г | 13479 | 1.79 |
Д | 24611 | 3.26 |
Е-Ё | 63584 | 8.43 |
Ж | 13479 | 1.79 |
З | 12263 | 1.63 |
И-Й | 63440 | 8.41 |
К | 25605 | 3.40 |
Л | 36477 | 4.84 |
М | 24324 | 3.23 |
Н | 48867 | 6.48 |
О | 83604 | 11.09 |
П | 20812 | 2.76 |
Р | 33324 | 4.42 |
С | 40722 | 5.40 |
Т | 45977 | 6.10 |
У | 20722 | 2.75 |
Ф | 1245 | 0.17 |
Х | 7080 | 0.94 |
Ц | 3135 | 0.42 |
Ч | 11074 | 1.47 |
Ш | 6195 | 0.82 |
Щ | 2668 | 0.35 |
Ь-Ъ | 14736 | 1.95 |
Ы | 16180 | 2.15 |
Э | 2269 | 0.30 |
Ю | 4344 | 0.58 |
Я | 15631 | 2.07 |
|
Части речи
Определенных частей речи (ОЧР) | 142981 слов |
Не определенных частей речи (НОЧР) | 130 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 39071 | 27.326 |
Глаг. | 13439 | 17.002 |
Мест.-сущ. | 13439 | 9.399 |
Предл. | 10899 | 11.013 |
Союз | 13329 | 9 |
Прилаг. | 10899 | 7.623 |
Нареч. | 7160 | 5.008 |
Местоим-прилаг. | 7933 | 5.548 |
Частица | 6103 | 4.268 |
Местоим. нареч. | 2397 | 1.676 |
Числит. | 2135 | 1.493 |
Числит-прилаг. | 336 | 0.235 |
Междомет. | 97 | 0.068 |
Часть комп. сложн. слова | 25 | 0.017 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 55.07 | 49.64 | 20.76 | 40.20 | 46.10 | 16.20 | 12.94 | 14.72 | 9.23 | 5.03 | 2.44 | 0.50 | 0.31 | 0.11 |
Глаг. | 33.70 | 17.08 | 19.59 | 37.59 | 17.04 | 12.25 | 9.54 | 9.97 | 7.78 | 2.83 | 2.22 | 0.32 | 0.09 | 0.01 |
Мест.-сущ. | 12.71 | 33.75 | 4.81 | 7.55 | 7.71 | 4.90 | 8.27 | 3.12 | 8.03 | 2.39 | 0.68 | 0.05 | 0.03 | 0.00 |
Предл. | 51.99 | 1.73 | 17.93 | 0.46 | 0.70 | 15.04 | 0.67 | 16.04 | 0.12 | 0.10 | 4.38 | 0.92 | 0.02 | 0.03 |
Союз | 16.94 | 18.76 | 14.31 | 8.22 | 4.37 | 6.70 | 7.56 | 5.09 | 6.97 | 3.08 | 0.94 | 0.22 | 0.05 | 0.01 |
Прилаг. | 54.13 | 2.82 | 1.60 | 2.91 | 5.29 | 5.78 | 0.90 | 1.15 | 0.75 | 0.45 | 0.34 | 0.02 | 0.08 | 0.00 |
Нареч. | 4.18 | 17.62 | 3.99 | 5.12 | 5.11 | 4.68 | 3.59 | 1.54 | 2.95 | 0.57 | 0.66 | 0.05 | 0.01 | 0.01 |
Местоим-прилаг. | 27.11 | 5.82 | 4.27 | 2.84 | 1.62 | 6.27 | 1.78 | 1.57 | 2.29 | 1.10 | 0.62 | 0.17 | 0.04 | 0.00 |
Частица | 4.95 | 18.77 | 3.89 | 3.36 | 1.79 | 2.13 | 2.85 | 1.62 | 2.05 | 0.78 | 0.45 | 0.04 | 0.01 | 0.00 |
Местоим. нареч. | 1.20 | 3.29 | 2.43 | 1.07 | 2.69 | 1.20 | 1.64 | 0.38 | 2.29 | 0.36 | 0.22 | 0.00 | 0.00 | 0.00 |
Числит. | 9.55 | 0.50 | 0.24 | 0.64 | 0.59 | 0.88 | 0.25 | 0.15 | 0.07 | 0.04 | 1.96 | 0.03 | 0.01 | 0.00 |
Числит-прилаг. | 1.48 | 0.19 | 0.06 | 0.09 | 0.10 | 0.15 | 0.04 | 0.08 | 0.11 | 0.01 | 0.03 | 0.01 | 0.00 | 0.00 |
Междомет. | 0.19 | 0.04 | 0.11 | 0.06 | 0.09 | 0.01 | 0.04 | 0.06 | 0.04 | 0.01 | 0.00 | 0.00 | 0.03 | 0.00 |
Часть комп. сложн. слова | 0.06 | 0.01 | 0.01 | 0.01 | 0.02 | 0.03 | 0.01 | 0.01 | 0.01 | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 17.64 | 20.54 | 24.29 | 25.07 | 27.02 |
Глаг. | 9.14 | 22.56 | 22.35 | 20.76 | 17.87 |
Мест.-сущ. | 17.25 | 15.21 | 11.99 | 10.35 | 9.85 |
Предл. | 13.00 | 6.98 | 9.32 | 10.61 | 11.22 |
Союз | 14.97 | 5.10 | 6.28 | 8.03 | 8.56 |
Прилаг. | 4.16 | 5.11 | 6.89 | 7.16 | 7.53 |
Нареч. | 8.08 | 6.21 | 5.22 | 5.01 | 4.83 |
Местоим-прилаг. | 5.67 | 7.27 | 4.85 | 5.79 | 6.22 |
Частица | 4.54 | 6.95 | 5.05 | 3.87 | 3.87 |
Местоим. нареч. | 4.17 | 1.96 | 1.97 | 1.51 | 1.19 |
Числит. | 0.75 | 1.42 | 1.30 | 1.45 | 1.54 |
Числит-прилаг. | 0.24 | 0.55 | 0.38 | 0.23 | 0.21 |
Междомет. | 0.39 | 0.10 | 0.11 | 0.07 | 0.05 |
Часть комп. сложн. слова | 0.00 | 0.03 | 0.01 | 0.09 | 0.02 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 28.52 | 27.33 | 28.52 | 27.49 | 27.00 |
Глаг. | 18.54 | 16.68 | 16.68 | 16.65 | 16.26 |
Мест.-сущ. | 8.22 | 8.53 | 8.48 | 8.10 | 8.37 |
Предл. | 10.80 | 12.10 | 10.70 | 11.49 | 11.54 |
Союз | 9.15 | 9.88 | 9.61 | 10.07 | 9.76 |
Прилаг. | 8.12 | 8.43 | 8.15 | 7.49 | 8.01 |
Нареч. | 4.41 | 4.34 | 4.20 | 5.29 | 5.70 |
Местоим-прилаг. | 5.30 | 5.60 | 5.51 | 5.68 | 5.58 |
Частица | 3.64 | 4.00 | 4.42 | 4.34 | 4.00 |
Местоим. нареч. | 1.36 | 1.50 | 1.79 | 1.45 | 1.63 |
Числит. | 1.62 | 1.43 | 1.60 | 1.71 | 1.82 |
Числит-прилаг. | 0.19 | 0.07 | 0.21 | 0.17 | 0.25 |
Междомет. | 0.11 | 0.05 | 0.09 | 0.04 | 0.06 |
Часть комп. сложн. слова | 0.02 | 0.07 | 0.05 | 0.04 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 26.52 | 27.11 | 27.67 | 27.59 | 26.73 |
Глаг. | 17.24 | 16.02 | 16.77 | 15.40 | 16.53 |
Мест.-сущ. | 8.05 | 7.78 | 7.62 | 7.45 | 8.69 |
Предл. | 11.76 | 11.67 | 12.02 | 12.63 | 11.88 |
Союз | 9.83 | 10.20 | 10.08 | 10.15 | 10.82 |
Прилаг. | 8.88 | 8.39 | 8.12 | 8.47 | 8.05 |
Нареч. | 4.16 | 4.90 | 4.28 | 4.88 | 3.93 |
Местоим-прилаг. | 5.71 | 6.64 | 5.33 | 5.65 | 5.42 |
Частица | 4.18 | 3.96 | 4.61 | 4.36 | 4.36 |
Местоим. нареч. | 1.37 | 1.32 | 1.57 | 1.56 | 1.46 |
Числит. | 2.07 | 1.82 | 1.54 | 1.71 | 1.75 |
Числит-прилаг. | 0.19 | 0.13 | 0.30 | 0.15 | 0.29 |
Междомет. | 0.04 | 0.04 | 0.09 | 0.00 | 0.08 |
Часть комп. сложн. слова | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 |
Последние комментарии
10 минут 4 секунд назад
4 часов 18 минут назад
4 часов 35 минут назад
4 часов 55 минут назад
7 часов 37 минут назад
15 часов 43 секунд назад