Лингвистический анализ: Гарри Поттер. Полная коллекция (Джоан Роулинг)
Общая статистика
Длина текста | 5610953 знаков |
Длина диалогов | 2938994 знаков |
Слов в произведении (СВП) | 841678 слов |
Приблизительно страниц | 3118 стр. |
Средняя длина слова | 5.25 знаков |
Предложений в произведении (ПВП) | 66291 предл. |
Средняя длина предложения (СДП) | 81.84 знаков |
Доля диалогов в тексте | 52.38 % |
Доля авторского текста | 47.62 % |
СДП диалогов | 81.25 знаков |
СДП авторского текста | 92.36 знаков |
|
Максимальный фрагмент авторского текста - 21192 знаков (в страницах - примерно 12, начинается где-то с 2844 страницы) |
Активный словарный запас
Использовано уникальных слов | 69597 | |
Активный словарный запас (АСЗ) | 65570 | |
Активный не словарный запас (АНСЗ) | 4027 | |
Удельный АСЗ на 3000 слов текста | 1491.79 | 403729 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3876.43 | 350125 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 19997.94 | 29357 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1757) наблюдается примерно на 2581 странице |
Минимальный УАСЗ-3000 (1269) наблюдается примерно на 1722 странице |
|
Буквы и знаки препинания
Всего букв | 4420787 букв |
Всего знаков препинания | 205406 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 102699 | 122.02 |
. | 63803 | 75.80 |
- | 10143 | 12.05 |
? | 10696 | 12.71 |
! | 9380 | 11.14 |
... | 0 | 0.00 |
!.. | 216 | 0.26 |
?.. | 387 | 0.46 |
!!! | 8 | 0.01 |
?! | 241 | 0.29 |
" | 0 | 0.00 |
() | 395 | 0.47 |
: | 4890 | 5.81 |
; | 2548 | 3.03 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 365709 | 8.27 |
Б | 70853 | 1.60 |
В | 177484 | 4.01 |
Г | 99905 | 2.26 |
Д | 140333 | 3.17 |
Е-Ё | 342133 | 7.74 |
Ж | 99905 | 2.26 |
З | 85043 | 1.92 |
И-Й | 350318 | 7.92 |
К | 141815 | 3.21 |
Л | 249115 | 5.64 |
М | 140923 | 3.19 |
Н | 282114 | 6.38 |
О | 485803 | 10.99 |
П | 130061 | 2.94 |
Р | 250092 | 5.66 |
С | 231286 | 5.23 |
Т | 246213 | 5.57 |
У | 134337 | 3.04 |
Ф | 12394 | 0.28 |
Х | 34742 | 0.79 |
Ц | 13169 | 0.30 |
Ч | 64435 | 1.46 |
Ш | 37782 | 0.85 |
Щ | 13631 | 0.31 |
Ь-Ъ | 87398 | 1.98 |
Ы | 72053 | 1.63 |
Э | 11357 | 0.26 |
Ю | 21655 | 0.49 |
Я | 88657 | 2.01 |
|
Части речи
Определенных частей речи (ОЧР) | 841031 слов |
Не определенных частей речи (НОЧР) | 647 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 233500 | 27.764 |
Глаг. | 78983 | 20.764 |
Мест.-сущ. | 78983 | 9.391 |
Предл. | 48737 | 10.167 |
Союз | 72814 | 9 |
Прилаг. | 48737 | 5.795 |
Нареч. | 58128 | 6.912 |
Местоим-прилаг. | 27618 | 3.284 |
Частица | 39581 | 4.706 |
Местоим. нареч. | 13670 | 1.625 |
Числит. | 4690 | 0.558 |
Числит-прилаг. | 1713 | 0.204 |
Междомет. | 1442 | 0.171 |
Часть комп. сложн. слова | 16 | 0.002 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 60.94 | 65.05 | 20.24 | 33.25 | 38.95 | 10.79 | 21.85 | 8.17 | 11.41 | 4.47 | 1.27 | 0.60 | 0.66 | 0.00 |
Глаг. | 60.97 | 22.43 | 20.68 | 39.02 | 22.15 | 11.75 | 12.83 | 5.96 | 7.28 | 3.10 | 0.91 | 0.29 | 0.27 | 0.00 |
Мест.-сущ. | 10.94 | 32.00 | 6.42 | 7.60 | 5.89 | 4.50 | 10.08 | 2.79 | 10.46 | 2.57 | 0.48 | 0.09 | 0.10 | 0.00 |
Предл. | 59.08 | 1.91 | 14.76 | 1.44 | 1.19 | 12.36 | 0.82 | 7.86 | 0.19 | 0.06 | 1.26 | 0.70 | 0.03 | 0.01 |
Союз | 17.25 | 18.76 | 15.54 | 6.79 | 3.78 | 3.36 | 8.21 | 3.40 | 6.05 | 2.95 | 0.33 | 0.08 | 0.08 | 0.00 |
Прилаг. | 37.95 | 4.76 | 1.60 | 1.87 | 3.59 | 5.10 | 1.26 | 0.52 | 0.79 | 0.26 | 0.19 | 0.01 | 0.04 | 0.00 |
Нареч. | 5.95 | 29.85 | 5.12 | 5.38 | 5.06 | 4.14 | 6.38 | 1.48 | 4.34 | 0.91 | 0.40 | 0.05 | 0.05 | 0.00 |
Местоим-прилаг. | 13.48 | 5.43 | 2.80 | 1.71 | 1.22 | 2.90 | 2.27 | 0.82 | 1.49 | 0.39 | 0.23 | 0.06 | 0.03 | 0.00 |
Частица | 4.57 | 22.69 | 3.82 | 3.21 | 2.32 | 1.82 | 3.33 | 1.32 | 2.73 | 1.02 | 0.18 | 0.03 | 0.04 | 0.00 |
Местоим. нареч. | 1.60 | 3.87 | 2.54 | 1.04 | 1.87 | 0.59 | 1.74 | 0.39 | 2.06 | 0.47 | 0.04 | 0.01 | 0.02 | 0.00 |
Числит. | 3.15 | 0.51 | 0.16 | 0.21 | 0.30 | 0.49 | 0.21 | 0.09 | 0.06 | 0.02 | 0.28 | 0.10 | 0.00 | 0.00 |
Числит-прилаг. | 1.40 | 0.16 | 0.06 | 0.09 | 0.08 | 0.10 | 0.04 | 0.02 | 0.06 | 0.01 | 0.01 | 0.02 | 0.00 | 0.00 |
Междомет. | 0.35 | 0.22 | 0.17 | 0.05 | 0.18 | 0.05 | 0.11 | 0.03 | 0.14 | 0.02 | 0.00 | 0.00 | 0.40 | 0.00 |
Часть комп. сложн. слова | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 27.04 | 19.81 | 23.62 | 26.58 | 27.59 |
Глаг. | 9.42 | 27.84 | 26.51 | 24.44 | 22.75 |
Мест.-сущ. | 16.66 | 11.25 | 9.66 | 9.12 | 8.45 |
Предл. | 9.03 | 6.91 | 10.23 | 10.31 | 10.67 |
Союз | 13.73 | 6.01 | 6.63 | 7.50 | 8.76 |
Прилаг. | 3.43 | 3.95 | 4.72 | 5.55 | 5.83 |
Нареч. | 7.64 | 9.98 | 7.73 | 6.92 | 6.57 |
Местоим-прилаг. | 3.45 | 3.19 | 2.79 | 3.15 | 3.06 |
Частица | 5.34 | 7.51 | 5.56 | 4.37 | 4.21 |
Местоим. нареч. | 2.73 | 2.22 | 1.63 | 1.32 | 1.31 |
Числит. | 0.49 | 0.69 | 0.48 | 0.51 | 0.55 |
Числит-прилаг. | 0.15 | 0.41 | 0.28 | 0.16 | 0.16 |
Междомет. | 0.90 | 0.24 | 0.17 | 0.07 | 0.08 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 27.86 | 27.88 | 27.27 | 27.57 | 27.62 |
Глаг. | 21.60 | 20.77 | 20.65 | 20.01 | 19.71 |
Мест.-сущ. | 8.51 | 8.24 | 8.36 | 8.08 | 8.60 |
Предл. | 10.94 | 11.17 | 11.62 | 11.50 | 11.39 |
Союз | 9.38 | 9.39 | 9.26 | 9.49 | 9.47 |
Прилаг. | 6.22 | 6.19 | 6.43 | 6.48 | 6.29 |
Нареч. | 6.39 | 6.47 | 6.57 | 6.37 | 6.33 |
Местоим-прилаг. | 2.97 | 3.22 | 3.32 | 3.40 | 3.60 |
Частица | 3.96 | 4.30 | 4.25 | 4.61 | 4.61 |
Местоим. нареч. | 1.35 | 1.55 | 1.42 | 1.48 | 1.55 |
Числит. | 0.55 | 0.56 | 0.60 | 0.68 | 0.60 |
Числит-прилаг. | 0.15 | 0.16 | 0.19 | 0.20 | 0.15 |
Междомет. | 0.12 | 0.10 | 0.07 | 0.12 | 0.07 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 27.46 | 27.03 | 27.03 | 27.00 | 26.72 |
Глаг. | 19.82 | 19.22 | 19.87 | 19.47 | 19.19 |
Мест.-сущ. | 8.49 | 9.07 | 8.70 | 8.90 | 8.80 |
Предл. | 11.40 | 11.86 | 11.66 | 11.52 | 12.21 |
Союз | 9.41 | 9.18 | 8.97 | 9.30 | 9.23 |
Прилаг. | 6.56 | 6.79 | 6.89 | 6.90 | 6.73 |
Нареч. | 6.34 | 6.21 | 6.38 | 6.30 | 6.28 |
Местоим-прилаг. | 3.84 | 3.48 | 3.49 | 3.43 | 3.55 |
Частица | 4.37 | 4.71 | 4.62 | 4.72 | 4.84 |
Местоим. нареч. | 1.55 | 1.66 | 1.58 | 1.57 | 1.39 |
Числит. | 0.49 | 0.51 | 0.54 | 0.63 | 0.75 |
Числит-прилаг. | 0.13 | 0.18 | 0.17 | 0.17 | 0.21 |
Междомет. | 0.13 | 0.08 | 0.09 | 0.09 | 0.11 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 |
Последние комментарии
4 часов 33 минут назад
5 часов 40 минут назад
6 часов 38 минут назад
6 часов 52 минут назад
16 часов 2 минут назад
16 часов 4 минут назад