Лингвистический анализ: Том 8. Личные воспоминания о Жанне д'Арк. Том Сойер – сыщик (Марк Твен)
Общая статистика
Длина текста | 837401 знаков |
Длина диалогов | 211093 знаков |
Слов в произведении (СВП) | 134662 слов |
Приблизительно страниц | 466 стр. |
Средняя длина слова | 4.95 знаков |
Предложений в произведении (ПВП) | 9347 предл. |
Средняя длина предложения (СДП) | 86.79 знаков |
Доля диалогов в тексте | 25.21 % |
Доля авторского текста | 74.79 % |
СДП диалогов | 87.92 знаков |
СДП авторского текста | 118.17 знаков |
|
Максимальный фрагмент авторского текста - 28281 знаков (в страницах - примерно 16, начинается где-то с 1 страницы) |
Активный словарный запас
Использовано уникальных слов | 24247 | |
Активный словарный запас (АСЗ) | 23772 | |
Активный не словарный запас (АНСЗ) | 475 | |
Удельный АСЗ на 3000 слов текста | 1421.50 | 426873 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3706.24 | 361500 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 20026.10 | 6566 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1709) наблюдается примерно на 449 странице |
Минимальный УАСЗ-3000 (1116) наблюдается примерно на 415 странице |
|
Буквы и знаки препинания
Всего букв | 665557 букв |
Всего знаков препинания | 27591 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 14553 | 108.07 |
. | 7654 | 56.84 |
- | 807 | 5.99 |
? | 1029 | 7.64 |
! | 1056 | 7.84 |
... | 3 | 0.02 |
!.. | 11 | 0.08 |
?.. | 3 | 0.02 |
!!! | 0 | 0.00 |
?! | 5 | 0.04 |
" | 0 | 0.00 |
() | 85 | 0.63 |
: | 1267 | 9.41 |
; | 1118 | 8.30 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 56765 | 8.53 |
Б | 12292 | 1.85 |
В | 28149 | 4.23 |
Г | 11939 | 1.79 |
Д | 22092 | 3.32 |
Е-Ё | 55985 | 8.41 |
Ж | 11939 | 1.79 |
З | 10684 | 1.61 |
И-Й | 53019 | 7.97 |
К | 20476 | 3.08 |
Л | 33894 | 5.09 |
М | 20325 | 3.05 |
Н | 45788 | 6.88 |
О | 74813 | 11.24 |
П | 17561 | 2.64 |
Р | 27163 | 4.08 |
С | 35457 | 5.33 |
Т | 40105 | 6.03 |
У | 17692 | 2.66 |
Ф | 926 | 0.14 |
Х | 5471 | 0.82 |
Ц | 2671 | 0.40 |
Ч | 9580 | 1.44 |
Ш | 5294 | 0.80 |
Щ | 1991 | 0.30 |
Ь-Ъ | 14024 | 2.11 |
Ы | 13521 | 2.03 |
Э | 2895 | 0.43 |
Ю | 3502 | 0.53 |
Я | 13860 | 2.08 |
|
Части речи
Определенных частей речи (ОЧР) | 134283 слов |
Не определенных частей речи (НОЧР) | 379 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 30450 | 22.676 |
Глаг. | 17561 | 19.673 |
Мест.-сущ. | 17561 | 13.078 |
Предл. | 8168 | 9.210 |
Союз | 14612 | 11 |
Прилаг. | 8168 | 6.083 |
Нареч. | 7172 | 5.341 |
Местоим-прилаг. | 7101 | 5.288 |
Частица | 6648 | 4.951 |
Местоим. нареч. | 2634 | 1.962 |
Числит. | 842 | 0.627 |
Числит-прилаг. | 226 | 0.168 |
Междомет. | 83 | 0.062 |
Часть комп. сложн. слова | 2 | 0.001 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 40.50 | 43.03 | 23.67 | 26.47 | 45.75 | 10.36 | 10.61 | 11.59 | 8.78 | 4.52 | 0.87 | 0.36 | 0.22 | 0.01 |
Глаг. | 34.11 | 22.74 | 29.39 | 35.51 | 25.78 | 11.78 | 12.02 | 10.69 | 8.92 | 4.30 | 1.06 | 0.26 | 0.18 | 0.00 |
Мест.-сущ. | 15.39 | 49.95 | 9.32 | 8.15 | 10.48 | 6.53 | 10.81 | 4.47 | 11.73 | 3.29 | 0.54 | 0.09 | 0.03 | 0.00 |
Предл. | 42.09 | 0.98 | 22.35 | 0.32 | 1.31 | 9.74 | 0.33 | 12.73 | 0.14 | 0.06 | 1.40 | 0.64 | 0.00 | 0.00 |
Союз | 16.63 | 23.99 | 22.96 | 7.66 | 4.78 | 6.17 | 8.34 | 5.97 | 8.35 | 3.37 | 0.46 | 0.13 | 0.02 | 0.00 |
Прилаг. | 39.80 | 3.18 | 2.32 | 2.33 | 6.26 | 3.79 | 0.77 | 0.86 | 0.71 | 0.50 | 0.22 | 0.02 | 0.07 | 0.00 |
Нареч. | 3.92 | 19.13 | 5.79 | 4.34 | 6.11 | 3.34 | 3.71 | 1.94 | 3.60 | 0.86 | 0.61 | 0.03 | 0.04 | 0.00 |
Местоим-прилаг. | 23.02 | 7.19 | 4.52 | 2.35 | 2.34 | 5.99 | 1.86 | 1.76 | 2.44 | 0.99 | 0.35 | 0.05 | 0.01 | 0.00 |
Частица | 4.92 | 21.42 | 6.16 | 3.51 | 2.81 | 1.82 | 3.12 | 2.15 | 2.23 | 1.11 | 0.20 | 0.04 | 0.01 | 0.00 |
Местоим. нареч. | 1.32 | 4.56 | 3.90 | 1.10 | 2.70 | 0.81 | 1.68 | 0.50 | 2.40 | 0.51 | 0.11 | 0.01 | 0.01 | 0.00 |
Числит. | 3.92 | 0.34 | 0.22 | 0.25 | 0.31 | 0.39 | 0.10 | 0.13 | 0.06 | 0.05 | 0.45 | 0.05 | 0.00 | 0.00 |
Числит-прилаг. | 1.07 | 0.12 | 0.09 | 0.10 | 0.04 | 0.04 | 0.03 | 0.04 | 0.09 | 0.04 | 0.01 | 0.00 | 0.01 | 0.00 |
Междомет. | 0.05 | 0.09 | 0.10 | 0.01 | 0.14 | 0.06 | 0.02 | 0.04 | 0.06 | 0.01 | 0.00 | 0.00 | 0.04 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 15.58 | 16.03 | 18.76 | 21.00 | 22.83 |
Глаг. | 7.45 | 28.99 | 25.20 | 23.79 | 20.10 |
Мест.-сущ. | 25.32 | 17.33 | 14.16 | 12.77 | 11.79 |
Предл. | 8.94 | 5.48 | 8.64 | 9.19 | 10.04 |
Союз | 17.03 | 5.71 | 8.37 | 9.76 | 11.25 |
Прилаг. | 2.50 | 3.59 | 4.80 | 5.63 | 6.56 |
Нареч. | 6.40 | 6.34 | 6.72 | 5.01 | 5.04 |
Местоим-прилаг. | 5.01 | 5.11 | 4.36 | 5.22 | 5.44 |
Частица | 6.32 | 8.26 | 6.00 | 4.64 | 4.66 |
Местоим. нареч. | 4.64 | 2.11 | 1.94 | 1.88 | 1.49 |
Числит. | 0.37 | 0.64 | 0.79 | 0.84 | 0.67 |
Числит-прилаг. | 0.05 | 0.36 | 0.20 | 0.21 | 0.10 |
Междомет. | 0.38 | 0.05 | 0.06 | 0.06 | 0.04 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 22.92 | 23.52 | 22.83 | 21.89 | 22.17 |
Глаг. | 19.46 | 19.06 | 19.62 | 19.99 | 18.66 |
Мест.-сущ. | 12.10 | 11.34 | 11.74 | 11.63 | 12.06 |
Предл. | 10.00 | 9.60 | 9.25 | 9.83 | 11.12 |
Союз | 11.50 | 12.66 | 11.56 | 11.77 | 10.99 |
Прилаг. | 6.28 | 5.95 | 7.20 | 6.14 | 6.64 |
Нареч. | 5.03 | 5.09 | 5.01 | 5.20 | 5.58 |
Местоим-прилаг. | 5.87 | 5.45 | 5.04 | 5.63 | 5.66 |
Частица | 4.00 | 4.49 | 4.96 | 5.29 | 4.72 |
Местоим. нареч. | 1.93 | 1.73 | 1.83 | 1.63 | 1.58 |
Числит. | 0.65 | 0.77 | 0.68 | 0.66 | 0.68 |
Числит-прилаг. | 0.21 | 0.30 | 0.25 | 0.22 | 0.14 |
Междомет. | 0.06 | 0.03 | 0.02 | 0.09 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.02 | 0.02 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 23.21 | 22.66 | 22.63 | 23.09 | 22.61 |
Глаг. | 18.67 | 18.74 | 19.47 | 17.62 | 17.90 |
Мест.-сущ. | 11.81 | 12.68 | 11.40 | 11.63 | 11.23 |
Предл. | 9.85 | 9.98 | 10.70 | 11.32 | 9.99 |
Союз | 11.92 | 12.24 | 10.45 | 12.12 | 12.26 |
Прилаг. | 6.80 | 6.69 | 6.81 | 6.76 | 6.76 |
Нареч. | 4.91 | 4.92 | 4.87 | 4.62 | 5.25 |
Местоим-прилаг. | 5.53 | 5.22 | 5.93 | 5.74 | 6.16 |
Частица | 4.93 | 4.18 | 5.30 | 4.59 | 5.71 |
Местоим. нареч. | 1.78 | 1.83 | 1.81 | 1.73 | 1.33 |
Числит. | 0.49 | 0.67 | 0.45 | 0.58 | 0.69 |
Числит-прилаг. | 0.06 | 0.14 | 0.18 | 0.19 | 0.09 |
Междомет. | 0.04 | 0.05 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Последние комментарии
1 час 2 минут назад
1 час 10 минут назад
7 часов 22 минут назад
7 часов 26 минут назад
7 часов 37 минут назад
7 часов 43 минут назад