Лингвистический анализ: Простаки за границей или Путь новых паломников (Марк Твен)
Общая статистика
Длина текста | 1092048 знаков |
Длина диалогов | 38506 знаков |
Слов в произведении (СВП) | 170046 слов |
Приблизительно страниц | 607 стр. |
Средняя длина слова | 5.16 знаков |
Предложений в произведении (ПВП) | 9838 предл. |
Средняя длина предложения (СДП) | 108.11 знаков |
Доля диалогов в тексте | 3.53 % |
Доля авторского текста | 96.47 % |
СДП диалогов | 59.07 знаков |
СДП авторского текста | 116.65 знаков |
|
Максимальный фрагмент авторского текста - 94030 знаков (в страницах - примерно 52, начинается где-то с 388 страницы) |
Активный словарный запас
Использовано уникальных слов | 39344 | |
Активный словарный запас (АСЗ) | 34802 | |
Активный не словарный запас (АНСЗ) | 4542 | |
Удельный АСЗ на 3000 слов текста | 1700.87 | 385141 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4668.56 | 56560 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 27435.91 | 52315 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1899) наблюдается примерно на 592 странице |
Минимальный УАСЗ-3000 (1510) наблюдается примерно на 421 странице |
|
Буквы и знаки препинания
Всего букв | 876775 букв |
Всего знаков препинания | 33163 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 19531 | 114.86 |
. | 8775 | 51.60 |
- | 1263 | 7.43 |
? | 352 | 2.07 |
! | 796 | 4.68 |
... | 302 | 1.78 |
!.. | 8 | 0.05 |
?.. | 5 | 0.03 |
!!! | 0 | 0.00 |
?! | 0 | 0.00 |
" | 0 | 0.00 |
() | 379 | 2.23 |
: | 537 | 3.16 |
; | 1215 | 7.15 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 68106 | 7.77 |
Б | 14193 | 1.62 |
В | 38622 | 4.41 |
Г | 16174 | 1.84 |
Д | 27690 | 3.16 |
Е-Ё | 74196 | 8.46 |
Ж | 16174 | 1.84 |
З | 14379 | 1.64 |
И-Й | 76662 | 8.74 |
К | 29762 | 3.39 |
Л | 39239 | 4.48 |
М | 29936 | 3.41 |
Н | 58101 | 6.63 |
О | 94643 | 10.79 |
П | 24048 | 2.74 |
Р | 40045 | 4.57 |
С | 47502 | 5.42 |
Т | 52788 | 6.02 |
У | 22108 | 2.52 |
Ф | 1768 | 0.20 |
Х | 10075 | 1.15 |
Ц | 4020 | 0.46 |
Ч | 11825 | 1.35 |
Ш | 6964 | 0.79 |
Щ | 3150 | 0.36 |
Ь-Ъ | 16001 | 1.82 |
Ы | 20640 | 2.35 |
Э | 2892 | 0.33 |
Ю | 5714 | 0.65 |
Я | 17702 | 2.02 |
|
Части речи
Определенных частей речи (ОЧР) | 168827 слов |
Не определенных частей речи (НОЧР) | 1219 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 50191 | 29.729 |
Глаг. | 14557 | 15.576 |
Мест.-сущ. | 14557 | 8.622 |
Предл. | 14611 | 10.861 |
Союз | 14980 | 9 |
Прилаг. | 14611 | 8.654 |
Нареч. | 8035 | 4.759 |
Местоим-прилаг. | 9189 | 5.443 |
Частица | 6839 | 4.051 |
Местоим. нареч. | 3219 | 1.907 |
Числит. | 2031 | 1.203 |
Числит-прилаг. | 323 | 0.191 |
Междомет. | 198 | 0.117 |
Часть комп. сложн. слова | 22 | 0.013 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 73.87 | 45.32 | 21.99 | 39.50 | 46.74 | 21.83 | 12.58 | 15.74 | 9.70 | 6.45 | 2.44 | 0.59 | 0.48 | 0.05 |
Глаг. | 34.15 | 14.51 | 16.74 | 35.02 | 14.31 | 12.50 | 8.29 | 8.10 | 6.91 | 3.19 | 1.63 | 0.23 | 0.17 | 0.01 |
Мест.-сущ. | 12.92 | 29.97 | 3.64 | 6.87 | 6.15 | 5.67 | 7.67 | 2.75 | 7.74 | 2.18 | 0.54 | 0.07 | 0.04 | 0.00 |
Предл. | 51.15 | 3.85 | 15.23 | 1.03 | 0.94 | 15.55 | 0.87 | 15.63 | 0.26 | 0.17 | 3.18 | 0.61 | 0.11 | 0.04 |
Союз | 17.99 | 16.72 | 13.28 | 8.84 | 3.67 | 6.32 | 6.65 | 5.09 | 6.06 | 3.15 | 0.76 | 0.12 | 0.08 | 0.00 |
Прилаг. | 60.41 | 3.43 | 1.73 | 3.49 | 6.17 | 7.33 | 1.33 | 1.05 | 0.71 | 0.41 | 0.36 | 0.02 | 0.07 | 0.02 |
Нареч. | 5.62 | 14.59 | 3.84 | 4.64 | 4.52 | 4.66 | 3.45 | 1.61 | 3.16 | 0.79 | 0.63 | 0.05 | 0.02 | 0.01 |
Местоим-прилаг. | 24.32 | 5.94 | 3.96 | 3.31 | 1.47 | 7.56 | 2.10 | 1.84 | 2.17 | 1.14 | 0.50 | 0.10 | 0.03 | 0.01 |
Частица | 5.88 | 16.56 | 3.19 | 3.68 | 1.60 | 2.60 | 2.46 | 1.91 | 1.36 | 0.87 | 0.37 | 0.01 | 0.02 | 0.00 |
Местоим. нареч. | 1.85 | 4.13 | 2.18 | 1.60 | 2.50 | 1.52 | 1.88 | 0.38 | 2.18 | 0.63 | 0.20 | 0.01 | 0.01 | 0.00 |
Числит. | 7.58 | 0.47 | 0.24 | 0.41 | 0.50 | 0.75 | 0.27 | 0.23 | 0.12 | 0.05 | 1.31 | 0.07 | 0.03 | 0.00 |
Числит-прилаг. | 1.09 | 0.14 | 0.12 | 0.14 | 0.07 | 0.14 | 0.02 | 0.02 | 0.11 | 0.01 | 0.05 | 0.01 | 0.00 | 0.00 |
Междомет. | 0.39 | 0.12 | 0.08 | 0.07 | 0.08 | 0.09 | 0.04 | 0.08 | 0.04 | 0.03 | 0.04 | 0.01 | 0.12 | 0.00 |
Часть комп. сложн. слова | 0.08 | 0.01 | 0.01 | 0.00 | 0.01 | 0.02 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 19.16 | 24.00 | 26.57 | 29.19 | 29.97 |
Глаг. | 7.12 | 22.89 | 19.69 | 17.76 | 16.87 |
Мест.-сущ. | 20.94 | 11.55 | 10.26 | 9.23 | 7.65 |
Предл. | 12.96 | 8.14 | 11.21 | 10.82 | 10.85 |
Союз | 12.85 | 4.29 | 6.31 | 6.77 | 8.35 |
Прилаг. | 5.81 | 6.51 | 7.24 | 8.81 | 8.80 |
Нареч. | 6.65 | 6.45 | 5.33 | 5.13 | 4.70 |
Местоим-прилаг. | 5.96 | 6.22 | 5.07 | 5.09 | 5.54 |
Частица | 3.43 | 5.93 | 4.85 | 3.95 | 4.25 |
Местоим. нареч. | 3.31 | 2.18 | 1.82 | 1.66 | 1.54 |
Числит. | 0.94 | 1.28 | 1.39 | 1.23 | 1.17 |
Числит-прилаг. | 0.34 | 0.33 | 0.14 | 0.23 | 0.25 |
Междомет. | 0.51 | 0.21 | 0.10 | 0.11 | 0.06 |
Часть комп. сложн. слова | 0.00 | 0.02 | 0.01 | 0.02 | 0.01 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 30.59 | 31.21 | 31.19 | 30.32 | 29.20 |
Глаг. | 15.99 | 14.98 | 15.09 | 15.28 | 15.99 |
Мест.-сущ. | 7.47 | 6.89 | 7.16 | 7.18 | 7.02 |
Предл. | 11.30 | 11.86 | 10.63 | 11.88 | 10.97 |
Союз | 9.12 | 8.99 | 9.56 | 9.08 | 9.29 |
Прилаг. | 9.28 | 8.93 | 9.07 | 8.79 | 9.36 |
Нареч. | 3.92 | 4.15 | 4.16 | 4.15 | 4.19 |
Местоим-прилаг. | 5.59 | 5.39 | 5.20 | 5.44 | 6.46 |
Частица | 3.34 | 3.76 | 4.08 | 4.36 | 4.10 |
Местоим. нареч. | 1.72 | 1.83 | 1.97 | 1.87 | 1.73 |
Числит. | 1.34 | 1.67 | 1.44 | 1.35 | 1.46 |
Числит-прилаг. | 0.25 | 0.16 | 0.27 | 0.21 | 0.14 |
Междомет. | 0.11 | 0.17 | 0.12 | 0.05 | 0.10 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.05 | 0.02 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 30.39 | 29.72 | 28.84 | 29.89 | 30.05 |
Глаг. | 15.23 | 14.83 | 15.91 | 14.09 | 14.54 |
Мест.-сущ. | 7.25 | 8.30 | 7.95 | 7.87 | 7.88 |
Предл. | 11.50 | 11.26 | 11.94 | 11.01 | 11.39 |
Союз | 9.71 | 9.83 | 9.41 | 10.97 | 10.07 |
Прилаг. | 9.03 | 8.99 | 9.19 | 8.99 | 8.94 |
Нареч. | 4.30 | 4.42 | 4.52 | 4.33 | 4.45 |
Местоим-прилаг. | 5.53 | 5.31 | 5.34 | 5.49 | 5.04 |
Частица | 3.67 | 3.78 | 4.03 | 4.13 | 4.49 |
Местоим. нареч. | 1.79 | 1.96 | 1.60 | 1.89 | 1.88 |
Числит. | 1.37 | 1.38 | 1.05 | 1.19 | 1.01 |
Числит-прилаг. | 0.13 | 0.16 | 0.12 | 0.09 | 0.16 |
Междомет. | 0.07 | 0.08 | 0.06 | 0.07 | 0.07 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.02 | 0.00 | 0.02 |
Последние комментарии
13 часов 41 минут назад
13 часов 55 минут назад
15 часов 3 минут назад
1 день 2 часов назад
1 день 2 часов назад
1 день 3 часов назад