Лингвистический анализ: Том 12. Из 'Автобиографии'. Из записных книжек 1865-1905. Избранные письма (Марк Твен)
Общая статистика
Длина текста | 1287938 знаков |
Длина диалогов | 41999 знаков |
Слов в произведении (СВП) | 199422 слов |
Приблизительно страниц | 716 стр. |
Средняя длина слова | 5.18 знаков |
Предложений в произведении (ПВП) | 12317 предл. |
Средняя длина предложения (СДП) | 101.63 знаков |
Доля диалогов в тексте | 3.26 % |
Доля авторского текста | 96.74 % |
СДП диалогов | 70.55 знаков |
СДП авторского текста | 106.10 знаков |
|
Максимальный фрагмент авторского текста - 106843 знаков (в страницах - примерно 59, начинается где-то с 264 страницы) |
Активный словарный запас
Использовано уникальных слов | 36420 | |
Активный словарный запас (АСЗ) | 35147 | |
Активный не словарный запас (АНСЗ) | 1273 | |
Удельный АСЗ на 3000 слов текста | 1497.20 | 3913 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4015.18 | 2764 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 23037.37 | 81068 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1743) наблюдается примерно на 527 странице |
Минимальный УАСЗ-3000 (1202) наблюдается примерно на 273 странице |
|
Буквы и знаки препинания
Всего букв | 1031228 букв |
Всего знаков препинания | 44034 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 22649 | 113.57 |
. | 11796 | 59.15 |
- | 4006 | 20.09 |
? | 399 | 2.00 |
! | 432 | 2.17 |
... | 158 | 0.79 |
!.. | 7 | 0.04 |
?.. | 3 | 0.02 |
!!! | 0 | 0.00 |
?! | 7 | 0.04 |
" | 1755 | 8.80 |
() | 615 | 3.08 |
: | 1008 | 5.05 |
; | 1199 | 6.01 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 78549 | 7.62 |
Б | 18300 | 1.77 |
В | 43906 | 4.26 |
Г | 18795 | 1.82 |
Д | 33120 | 3.21 |
Е-Ё | 90851 | 8.81 |
Ж | 18795 | 1.82 |
З | 16787 | 1.63 |
И-Й | 84252 | 8.17 |
К | 33113 | 3.21 |
Л | 48351 | 4.69 |
М | 35019 | 3.40 |
Н | 68196 | 6.61 |
О | 114033 | 11.06 |
П | 27609 | 2.68 |
Р | 45545 | 4.42 |
С | 55960 | 5.43 |
Т | 66105 | 6.41 |
У | 26873 | 2.61 |
Ф | 1848 | 0.18 |
Х | 8861 | 0.86 |
Ц | 3931 | 0.38 |
Ч | 16668 | 1.62 |
Ш | 7535 | 0.73 |
Щ | 3155 | 0.31 |
Ь-Ъ | 19878 | 1.93 |
Ы | 19771 | 1.92 |
Э | 4768 | 0.46 |
Ю | 7048 | 0.68 |
Я | 22613 | 2.19 |
|
Части речи
Определенных частей речи (ОЧР) | 199036 слов |
Не определенных частей речи (НОЧР) | 386 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 51803 | 26.027 |
Глаг. | 21739 | 16.622 |
Мест.-сущ. | 21739 | 10.922 |
Предл. | 14683 | 10.354 |
Союз | 19258 | 10 |
Прилаг. | 14683 | 7.377 |
Нареч. | 10400 | 5.225 |
Местоим-прилаг. | 11856 | 5.957 |
Частица | 9177 | 4.611 |
Местоим. нареч. | 3310 | 1.663 |
Числит. | 2541 | 1.277 |
Числит-прилаг. | 494 | 0.248 |
Междомет. | 71 | 0.036 |
Часть комп. сложн. слова | 12 | 0.006 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 57.79 | 39.56 | 24.16 | 36.38 | 43.88 | 15.19 | 11.88 | 14.68 | 8.82 | 4.80 | 2.33 | 0.62 | 0.17 | 0.02 |
Глаг. | 28.04 | 17.27 | 22.01 | 32.95 | 19.46 | 11.38 | 9.96 | 11.06 | 8.90 | 2.68 | 2.11 | 0.31 | 0.07 | 0.01 |
Мест.-сущ. | 13.43 | 40.04 | 5.78 | 8.35 | 7.52 | 6.28 | 9.94 | 3.63 | 10.76 | 2.73 | 0.61 | 0.13 | 0.01 | 0.02 |
Предл. | 49.14 | 1.22 | 19.20 | 0.46 | 0.92 | 11.89 | 0.57 | 16.12 | 0.13 | 0.07 | 2.98 | 0.79 | 0.05 | 0.01 |
Союз | 15.07 | 18.61 | 18.94 | 9.00 | 4.11 | 5.96 | 7.74 | 5.84 | 7.35 | 3.00 | 0.93 | 0.19 | 0.01 | 0.01 |
Прилаг. | 48.42 | 3.22 | 2.32 | 3.15 | 7.12 | 5.87 | 1.20 | 1.05 | 0.74 | 0.30 | 0.31 | 0.04 | 0.02 | 0.00 |
Нареч. | 4.01 | 15.53 | 5.13 | 4.85 | 5.90 | 5.24 | 4.87 | 1.80 | 3.12 | 0.93 | 0.78 | 0.06 | 0.01 | 0.00 |
Местоим-прилаг. | 28.98 | 5.60 | 4.73 | 3.12 | 1.89 | 7.52 | 1.70 | 2.24 | 2.17 | 0.93 | 0.51 | 0.17 | 0.01 | 0.00 |
Частица | 4.62 | 21.14 | 4.19 | 3.72 | 1.90 | 2.61 | 2.73 | 2.26 | 1.62 | 0.90 | 0.36 | 0.05 | 0.01 | 0.00 |
Местоим. нареч. | 1.02 | 3.52 | 2.30 | 0.97 | 3.17 | 1.07 | 1.40 | 0.58 | 2.29 | 0.22 | 0.09 | 0.01 | 0.00 | 0.00 |
Числит. | 7.99 | 0.33 | 0.30 | 0.48 | 0.65 | 0.62 | 0.23 | 0.23 | 0.11 | 0.05 | 1.68 | 0.10 | 0.00 | 0.00 |
Числит-прилаг. | 1.60 | 0.13 | 0.13 | 0.10 | 0.18 | 0.11 | 0.02 | 0.04 | 0.09 | 0.01 | 0.08 | 0.02 | 0.00 | 0.00 |
Междомет. | 0.11 | 0.04 | 0.04 | 0.02 | 0.04 | 0.01 | 0.01 | 0.06 | 0.02 | 0.02 | 0.00 | 0.00 | 0.01 | 0.00 |
Часть комп. сложн. слова | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 19.61 | 23.79 | 24.14 | 25.46 | 25.88 |
Глаг. | 7.61 | 24.46 | 20.81 | 19.25 | 18.18 |
Мест.-сущ. | 24.08 | 12.80 | 12.50 | 11.79 | 9.64 |
Предл. | 11.77 | 7.13 | 9.34 | 10.63 | 10.86 |
Союз | 12.79 | 4.21 | 7.32 | 7.80 | 9.21 |
Прилаг. | 4.26 | 4.98 | 6.78 | 7.44 | 7.62 |
Нареч. | 6.55 | 6.05 | 5.88 | 4.86 | 5.49 |
Местоим-прилаг. | 5.22 | 6.44 | 4.84 | 5.32 | 5.77 |
Частица | 3.78 | 6.83 | 5.03 | 4.54 | 4.10 |
Местоим. нареч. | 3.09 | 1.80 | 1.49 | 1.33 | 1.33 |
Числит. | 0.79 | 1.18 | 1.56 | 1.34 | 1.62 |
Числит-прилаг. | 0.29 | 0.29 | 0.28 | 0.22 | 0.28 |
Междомет. | 0.14 | 0.04 | 0.05 | 0.03 | 0.03 |
Часть комп. сложн. слова | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 26.23 | 27.07 | 26.64 | 25.66 | 24.21 |
Глаг. | 16.77 | 16.00 | 15.23 | 16.60 | 16.59 |
Мест.-сущ. | 9.67 | 8.89 | 9.54 | 9.78 | 9.45 |
Предл. | 10.74 | 11.30 | 10.97 | 10.95 | 11.57 |
Союз | 10.01 | 9.91 | 10.69 | 10.44 | 11.05 |
Прилаг. | 8.14 | 8.68 | 7.89 | 7.81 | 7.89 |
Нареч. | 4.97 | 4.63 | 4.65 | 5.18 | 4.96 |
Местоим-прилаг. | 5.95 | 5.90 | 6.39 | 6.24 | 6.42 |
Частица | 4.05 | 4.04 | 4.46 | 4.30 | 4.68 |
Местоим. нареч. | 1.52 | 1.57 | 1.69 | 1.42 | 1.63 |
Числит. | 1.60 | 1.79 | 1.57 | 1.44 | 1.20 |
Числит-прилаг. | 0.31 | 0.17 | 0.23 | 0.15 | 0.31 |
Междомет. | 0.03 | 0.02 | 0.04 | 0.03 | 0.03 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.02 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 25.23 | 25.79 | 24.19 | 23.83 | 24.57 |
Глаг. | 16.24 | 16.03 | 15.29 | 16.84 | 15.58 |
Мест.-сущ. | 10.44 | 10.01 | 9.94 | 9.99 | 9.74 |
Предл. | 10.85 | 11.32 | 11.59 | 10.97 | 11.41 |
Союз | 10.91 | 10.70 | 10.32 | 10.57 | 11.37 |
Прилаг. | 7.42 | 7.61 | 7.67 | 8.07 | 8.00 |
Нареч. | 4.64 | 4.63 | 5.40 | 5.54 | 4.95 |
Местоим-прилаг. | 6.33 | 5.82 | 7.18 | 6.09 | 5.94 |
Частица | 4.66 | 4.90 | 5.03 | 4.87 | 4.95 |
Местоим. нареч. | 1.52 | 1.57 | 1.73 | 1.67 | 1.80 |
Числит. | 1.49 | 1.35 | 1.34 | 1.33 | 1.43 |
Числит-прилаг. | 0.25 | 0.24 | 0.29 | 0.24 | 0.24 |
Междомет. | 0.01 | 0.00 | 0.03 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.03 | 0.00 | 0.00 | 0.02 |
Последние комментарии
2 часов 53 минут назад
3 часов 1 минута назад
3 часов 11 минут назад
3 часов 16 минут назад
4 часов 45 минут назад
4 часов 48 минут назад