Лингвистический анализ: Позолоченный век (Марк Твен)
Общая статистика
Длина текста | 957235 знаков |
Длина диалогов | 269572 знаков |
Слов в произведении (СВП) | 146623 слов |
Приблизительно страниц | 532 стр. |
Средняя длина слова | 5.23 знаков |
Предложений в произведении (ПВП) | 10544 предл. |
Средняя длина предложения (СДП) | 87.98 знаков |
Доля диалогов в тексте | 28.16 % |
Доля авторского текста | 71.84 % |
СДП диалогов | 71.62 знаков |
СДП авторского текста | 110.39 знаков |
|
Максимальный фрагмент авторского текста - 25191 знаков (в страницах - примерно 14, начинается где-то с 197 страницы) |
Активный словарный запас
Использовано уникальных слов | 29440 | |
Активный словарный запас (АСЗ) | 27728 | |
Активный не словарный запас (АНСЗ) | 1712 | |
Удельный АСЗ на 3000 слов текста | 1528.06 | 470298 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4075.16 | 409483 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 22809.41 | 15874 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1720) наблюдается примерно на 511 странице |
Минимальный УАСЗ-3000 (1249) наблюдается примерно на 334 странице |
|
Буквы и знаки препинания
Всего букв | 758478 букв |
Всего знаков препинания | 37177 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 17069 | 116.41 |
. | 8311 | 56.68 |
- | 5400 | 36.83 |
? | 1003 | 6.84 |
! | 1140 | 7.78 |
... | 528 | 3.60 |
!.. | 9 | 0.06 |
?.. | 4 | 0.03 |
!!! | 4 | 0.03 |
?! | 9 | 0.06 |
" | 1530 | 10.43 |
() | 312 | 2.13 |
: | 819 | 5.59 |
; | 1039 | 7.09 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 59395 | 7.83 |
Б | 13072 | 1.72 |
В | 32994 | 4.35 |
Г | 14481 | 1.91 |
Д | 24390 | 3.22 |
Е-Ё | 66542 | 8.77 |
Ж | 14481 | 1.91 |
З | 12379 | 1.63 |
И-Й | 61406 | 8.10 |
К | 24095 | 3.18 |
Л | 36563 | 4.82 |
М | 23415 | 3.09 |
Н | 50663 | 6.68 |
О | 84902 | 11.19 |
П | 20950 | 2.76 |
Р | 32965 | 4.35 |
С | 42065 | 5.55 |
Т | 47042 | 6.20 |
У | 20919 | 2.76 |
Ф | 1668 | 0.22 |
Х | 6794 | 0.90 |
Ц | 2433 | 0.32 |
Ч | 11397 | 1.50 |
Ш | 6120 | 0.81 |
Щ | 2501 | 0.33 |
Ь-Ъ | 15433 | 2.03 |
Ы | 14037 | 1.85 |
Э | 2658 | 0.35 |
Ю | 4344 | 0.57 |
Я | 14812 | 1.95 |
|
Части речи
Определенных частей речи (ОЧР) | 144727 слов |
Не определенных частей речи (НОЧР) | 1896 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 37903 | 26.189 |
Глаг. | 14812 | 17.320 |
Мест.-сущ. | 14812 | 10.234 |
Предл. | 10404 | 10.003 |
Союз | 14013 | 10 |
Прилаг. | 10404 | 7.189 |
Нареч. | 8395 | 5.801 |
Местоим-прилаг. | 7746 | 5.352 |
Частица | 7690 | 5.313 |
Местоим. нареч. | 2721 | 1.880 |
Числит. | 1124 | 0.777 |
Числит-прилаг. | 218 | 0.151 |
Междомет. | 148 | 0.102 |
Часть комп. сложн. слова | 9 | 0.006 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 56.76 | 47.97 | 19.01 | 34.68 | 43.90 | 14.36 | 14.24 | 12.04 | 11.20 | 5.10 | 1.70 | 0.46 | 0.46 | 0.01 |
Глаг. | 35.23 | 18.64 | 21.73 | 34.01 | 19.40 | 11.30 | 9.49 | 9.77 | 9.18 | 3.01 | 1.12 | 0.17 | 0.15 | 0.01 |
Мест.-сущ. | 14.33 | 30.93 | 6.36 | 7.61 | 8.24 | 6.39 | 10.39 | 4.08 | 10.32 | 3.10 | 0.46 | 0.06 | 0.06 | 0.00 |
Предл. | 48.04 | 1.79 | 18.37 | 0.50 | 1.08 | 12.65 | 0.75 | 14.28 | 0.23 | 0.15 | 1.51 | 0.58 | 0.07 | 0.03 |
Союз | 16.49 | 18.46 | 16.32 | 7.94 | 5.35 | 5.64 | 8.97 | 5.29 | 8.24 | 3.40 | 0.59 | 0.08 | 0.05 | 0.01 |
Прилаг. | 48.98 | 3.44 | 2.12 | 2.69 | 5.89 | 5.11 | 1.06 | 0.97 | 0.95 | 0.41 | 0.18 | 0.01 | 0.06 | 0.01 |
Нареч. | 4.91 | 20.22 | 5.01 | 4.39 | 5.50 | 5.19 | 4.91 | 1.72 | 4.77 | 0.82 | 0.50 | 0.05 | 0.02 | 0.00 |
Местоим-прилаг. | 24.41 | 5.50 | 4.51 | 2.35 | 2.05 | 6.34 | 2.22 | 2.07 | 2.44 | 1.21 | 0.35 | 0.05 | 0.03 | 0.00 |
Частица | 5.58 | 21.72 | 6.03 | 4.15 | 2.66 | 2.62 | 3.81 | 2.51 | 2.63 | 1.12 | 0.28 | 0.03 | 0.01 | 0.00 |
Местоим. нареч. | 1.42 | 3.90 | 2.49 | 1.33 | 2.16 | 1.53 | 1.93 | 0.53 | 2.94 | 0.45 | 0.10 | 0.00 | 0.01 | 0.00 |
Числит. | 4.46 | 0.41 | 0.25 | 0.26 | 0.46 | 0.50 | 0.18 | 0.15 | 0.09 | 0.03 | 0.95 | 0.02 | 0.01 | 0.00 |
Числит-прилаг. | 0.97 | 0.12 | 0.06 | 0.06 | 0.03 | 0.13 | 0.00 | 0.01 | 0.10 | 0.00 | 0.03 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.26 | 0.10 | 0.08 | 0.04 | 0.12 | 0.08 | 0.06 | 0.10 | 0.04 | 0.01 | 0.01 | 0.00 | 0.11 | 0.00 |
Часть комп. сложн. слова | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 20.14 | 22.10 | 22.08 | 24.93 | 26.01 |
Глаг. | 10.03 | 20.78 | 22.78 | 21.08 | 19.02 |
Мест.-сущ. | 15.61 | 14.38 | 11.65 | 10.76 | 9.86 |
Предл. | 10.24 | 6.21 | 9.15 | 9.97 | 10.54 |
Союз | 17.36 | 5.83 | 6.40 | 7.40 | 8.89 |
Прилаг. | 3.25 | 4.75 | 6.04 | 6.64 | 7.59 |
Нареч. | 6.74 | 7.56 | 7.23 | 6.50 | 5.43 |
Местоим-прилаг. | 4.15 | 5.58 | 4.82 | 4.83 | 5.12 |
Частица | 7.57 | 8.85 | 6.99 | 5.42 | 5.13 |
Местоим. нареч. | 3.11 | 2.59 | 1.73 | 1.64 | 1.61 |
Числит. | 0.73 | 0.76 | 0.79 | 0.65 | 0.66 |
Числит-прилаг. | 0.22 | 0.34 | 0.19 | 0.17 | 0.10 |
Междомет. | 0.85 | 0.26 | 0.11 | 0.01 | 0.05 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 26.17 | 26.71 | 27.28 | 26.26 | 25.10 |
Глаг. | 17.86 | 16.49 | 17.26 | 17.46 | 16.95 |
Мест.-сущ. | 9.54 | 9.27 | 9.11 | 10.14 | 9.00 |
Предл. | 10.82 | 10.74 | 10.19 | 10.68 | 11.05 |
Союз | 9.99 | 10.60 | 10.40 | 9.94 | 10.82 |
Прилаг. | 7.70 | 7.37 | 7.43 | 7.54 | 7.67 |
Нареч. | 5.50 | 5.59 | 4.84 | 5.49 | 5.29 |
Местоим-прилаг. | 4.92 | 5.62 | 6.00 | 5.19 | 5.97 |
Частица | 4.60 | 4.92 | 4.69 | 4.68 | 5.04 |
Местоим. нареч. | 1.88 | 1.56 | 1.73 | 1.92 | 2.03 |
Числит. | 0.82 | 0.97 | 0.93 | 0.62 | 0.91 |
Числит-прилаг. | 0.14 | 0.12 | 0.11 | 0.05 | 0.15 |
Междомет. | 0.04 | 0.03 | 0.03 | 0.02 | 0.00 |
Часть комп. сложн. слова | 0.01 | 0.02 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 25.99 | 25.03 | 25.96 | 24.99 | 25.76 |
Глаг. | 16.16 | 16.65 | 16.92 | 16.09 | 16.10 |
Мест.-сущ. | 9.53 | 10.05 | 9.70 | 9.56 | 9.66 |
Предл. | 10.98 | 11.67 | 10.14 | 10.98 | 11.50 |
Союз | 9.99 | 10.57 | 10.66 | 11.11 | 9.89 |
Прилаг. | 7.80 | 7.70 | 7.72 | 8.09 | 8.13 |
Нареч. | 5.42 | 5.02 | 5.04 | 5.35 | 5.27 |
Местоим-прилаг. | 5.85 | 5.34 | 6.40 | 6.03 | 5.67 |
Частица | 5.52 | 5.18 | 4.50 | 5.03 | 5.02 |
Местоим. нареч. | 1.71 | 1.76 | 1.88 | 1.90 | 1.96 |
Числит. | 0.92 | 0.95 | 0.90 | 0.71 | 0.94 |
Числит-прилаг. | 0.10 | 0.09 | 0.12 | 0.13 | 0.11 |
Междомет. | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.02 | 0.03 | 0.00 |
Последние комментарии
5 часов 52 минут назад
5 часов 55 минут назад
2 дней 12 часов назад
2 дней 16 часов назад
2 дней 18 часов назад
2 дней 19 часов назад