Лингвистический анализ: Оливер Твист (Чарльз Диккенс)
Общая статистика
Длина текста | 889772 знаков |
Длина диалогов | 405592 знаков |
Слов в произведении (СВП) | 145568 слов |
Приблизительно страниц | 495 стр. |
Средняя длина слова | 4.79 знаков |
Предложений в произведении (ПВП) | 7692 предл. |
Средняя длина предложения (СДП) | 112.90 знаков |
Доля диалогов в тексте | 45.58 % |
Доля авторского текста | 54.42 % |
СДП диалогов | 97.76 знаков |
СДП авторского текста | 156.72 знаков |
|
Максимальный фрагмент авторского текста - 13025 знаков (в страницах - примерно 7, начинается где-то с 504 страницы) |
Активный словарный запас
Использовано уникальных слов | 21534 | |
Активный словарный запас (АСЗ) | 18739 | |
Активный не словарный запас (АНСЗ) | 2795 | |
Удельный АСЗ на 3000 слов текста | 1351.03 | 391875 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3379.22 | 339599 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 16979.22 | 49105 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1476) наблюдается примерно на 275 странице |
Минимальный УАСЗ-3000 (1211) наблюдается примерно на 217 странице |
|
Буквы и знаки препинания
Всего букв | 697594 букв |
Всего знаков препинания | 28800 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 17196 | 118.13 |
. | 7048 | 48.42 |
- | 655 | 4.50 |
? | 1145 | 7.87 |
! | 1653 | 11.36 |
... | 0 | 0.00 |
!.. | 55 | 0.38 |
?.. | 14 | 0.10 |
!!! | 0 | 0.00 |
?! | 2 | 0.01 |
" | 0 | 0.00 |
() | 54 | 0.37 |
: | 336 | 2.31 |
; | 642 | 4.41 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 52352 | 7.50 |
Б | 12563 | 1.80 |
В | 29508 | 4.23 |
Г | 12492 | 1.79 |
Д | 21569 | 3.09 |
Е-Ё | 43334 | 6.21 |
Ж | 12492 | 1.79 |
З | 11655 | 1.67 |
И-Й | 50259 | 7.20 |
К | 23029 | 3.30 |
Л | 35179 | 5.04 |
М | 23296 | 3.34 |
Н | 41789 | 5.99 |
О | 75760 | 10.86 |
П | 16971 | 2.43 |
Р | 29891 | 4.28 |
С | 37118 | 5.32 |
Т | 42145 | 6.04 |
У | 19193 | 2.75 |
Ф | 753 | 0.11 |
Х | 5282 | 0.76 |
Ц | 1808 | 0.26 |
Ч | 10376 | 1.49 |
Ш | 5895 | 0.85 |
Щ | 2163 | 0.31 |
Ь-Ъ | 52146 | 7.48 |
Ы | 12647 | 1.81 |
Э | 2846 | 0.41 |
Ю | 3744 | 0.54 |
Я | 14584 | 2.09 |
|
Части речи
Определенных частей речи (ОЧР) | 141759 слов |
Не определенных частей речи (НОЧР) | 3809 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 45386 | 32.016 |
Глаг. | 15204 | 17.083 |
Мест.-сущ. | 15204 | 10.725 |
Предл. | 8129 | 9.336 |
Союз | 12581 | 9 |
Прилаг. | 8129 | 5.734 |
Нареч. | 6940 | 4.896 |
Местоим-прилаг. | 6596 | 4.653 |
Частица | 6223 | 4.390 |
Местоим. нареч. | 1947 | 1.373 |
Числит. | 761 | 0.537 |
Числит-прилаг. | 163 | 0.115 |
Междомет. | 378 | 0.267 |
Часть комп. сложн. слова | 1 | 0.001 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 107.96 | 52.05 | 26.19 | 32.03 | 42.25 | 13.08 | 13.76 | 14.50 | 11.31 | 3.24 | 2.24 | 0.30 | 1.23 | 0.00 |
Глаг. | 47.19 | 17.55 | 22.76 | 30.79 | 14.65 | 8.42 | 10.36 | 7.67 | 7.55 | 2.61 | 0.62 | 0.22 | 0.42 | 0.00 |
Мест.-сущ. | 21.94 | 30.70 | 7.09 | 9.14 | 9.22 | 5.74 | 7.92 | 3.29 | 8.97 | 2.64 | 0.37 | 0.04 | 0.20 | 0.00 |
Предл. | 43.26 | 4.66 | 17.66 | 1.31 | 1.42 | 9.39 | 1.09 | 12.45 | 0.71 | 0.17 | 0.80 | 0.36 | 0.07 | 0.01 |
Союз | 19.15 | 18.62 | 16.69 | 6.93 | 3.82 | 5.23 | 5.38 | 3.28 | 6.67 | 2.28 | 0.55 | 0.10 | 0.04 | 0.00 |
Прилаг. | 36.35 | 5.40 | 2.49 | 2.35 | 4.96 | 3.29 | 0.68 | 0.73 | 0.68 | 0.33 | 0.03 | 0.02 | 0.03 | 0.00 |
Нареч. | 9.27 | 15.80 | 3.17 | 4.04 | 4.94 | 3.34 | 3.65 | 1.03 | 2.99 | 0.47 | 0.18 | 0.01 | 0.06 | 0.00 |
Местоим-прилаг. | 20.82 | 6.63 | 3.98 | 2.14 | 1.75 | 5.70 | 1.54 | 1.16 | 1.81 | 0.79 | 0.10 | 0.04 | 0.06 | 0.00 |
Частица | 8.68 | 15.98 | 4.73 | 3.29 | 2.14 | 1.86 | 2.91 | 1.74 | 1.46 | 0.86 | 0.16 | 0.02 | 0.06 | 0.00 |
Местоим. нареч. | 1.80 | 2.39 | 1.86 | 0.85 | 2.61 | 0.80 | 1.40 | 0.35 | 1.41 | 0.22 | 0.04 | 0.00 | 0.01 | 0.00 |
Числит. | 2.71 | 0.44 | 0.31 | 0.30 | 0.52 | 0.32 | 0.15 | 0.14 | 0.13 | 0.06 | 0.28 | 0.01 | 0.00 | 0.00 |
Числит-прилаг. | 0.64 | 0.16 | 0.04 | 0.04 | 0.08 | 0.04 | 0.04 | 0.02 | 0.06 | 0.01 | 0.00 | 0.02 | 0.00 | 0.00 |
Междомет. | 0.39 | 0.44 | 0.28 | 0.16 | 0.37 | 0.12 | 0.06 | 0.16 | 0.15 | 0.06 | 0.00 | 0.00 | 0.49 | 0.00 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 22.79 | 26.88 | 32.04 | 32.86 | 35.51 |
Глаг. | 11.36 | 22.38 | 21.33 | 20.54 | 19.12 |
Мест.-сущ. | 18.07 | 12.86 | 11.26 | 10.92 | 9.70 |
Предл. | 8.92 | 6.01 | 7.68 | 8.60 | 9.05 |
Союз | 14.12 | 4.79 | 5.69 | 6.48 | 7.37 |
Прилаг. | 3.51 | 3.83 | 4.40 | 5.32 | 5.68 |
Нареч. | 5.43 | 6.72 | 6.04 | 5.22 | 4.83 |
Местоим-прилаг. | 3.24 | 5.34 | 3.84 | 4.00 | 3.81 |
Частица | 6.96 | 8.09 | 5.40 | 4.03 | 3.35 |
Местоим. нареч. | 2.92 | 1.93 | 1.37 | 1.22 | 0.96 |
Числит. | 0.54 | 0.46 | 0.47 | 0.49 | 0.51 |
Числит-прилаг. | 0.11 | 0.12 | 0.10 | 0.13 | 0.06 |
Междомет. | 2.04 | 0.58 | 0.39 | 0.18 | 0.05 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 35.32 | 34.21 | 33.93 | 33.73 | 33.38 |
Глаг. | 18.05 | 18.09 | 16.87 | 18.21 | 16.33 |
Мест.-сущ. | 9.44 | 9.78 | 9.19 | 8.88 | 9.77 |
Предл. | 8.62 | 8.19 | 10.27 | 9.23 | 10.18 |
Союз | 8.68 | 8.67 | 9.64 | 8.93 | 9.37 |
Прилаг. | 5.52 | 6.28 | 5.65 | 5.97 | 5.52 |
Нареч. | 4.16 | 4.63 | 4.33 | 5.05 | 4.87 |
Местоим-прилаг. | 4.73 | 4.51 | 4.42 | 4.39 | 4.48 |
Частица | 3.37 | 3.80 | 3.49 | 3.83 | 4.14 |
Местоим. нареч. | 1.29 | 1.11 | 1.31 | 1.14 | 1.09 |
Числит. | 0.53 | 0.49 | 0.73 | 0.43 | 0.59 |
Числит-прилаг. | 0.11 | 0.15 | 0.09 | 0.13 | 0.12 |
Междомет. | 0.16 | 0.09 | 0.09 | 0.06 | 0.16 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 31.62 | 32.24 | 31.57 | 30.74 | 31.91 |
Глаг. | 16.79 | 16.44 | 17.20 | 16.31 | 16.06 |
Мест.-сущ. | 9.63 | 10.37 | 10.33 | 10.14 | 10.29 |
Предл. | 10.01 | 10.55 | 9.51 | 10.51 | 10.37 |
Союз | 10.51 | 9.31 | 9.32 | 10.31 | 9.17 |
Прилаг. | 5.75 | 5.47 | 6.07 | 5.26 | 6.53 |
Нареч. | 4.74 | 4.50 | 4.93 | 5.08 | 5.35 |
Местоим-прилаг. | 4.78 | 4.92 | 4.56 | 4.91 | 4.10 |
Частица | 4.26 | 3.93 | 4.39 | 4.49 | 4.00 |
Местоим. нареч. | 1.17 | 1.46 | 1.36 | 1.41 | 1.44 |
Числит. | 0.40 | 0.51 | 0.58 | 0.62 | 0.57 |
Числит-прилаг. | 0.04 | 0.13 | 0.05 | 0.05 | 0.13 |
Междомет. | 0.29 | 0.15 | 0.14 | 0.17 | 0.08 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Последние комментарии
11 часов 8 минут назад
15 часов 22 минут назад
17 часов 41 минут назад
19 часов 30 минут назад
1 день 1 час назад
1 день 1 час назад