Лингвистический анализ: Тереза Ракен. Жерминаль (Эмиль Золя)
Общая статистика
Длина текста | 1487032 знаков |
Длина диалогов | 202077 знаков |
Слов в произведении (СВП) | 224478 слов |
Приблизительно страниц | 827 стр. |
Средняя длина слова | 5.35 знаков |
Предложений в произведении (ПВП) | 14439 предл. |
Средняя длина предложения (СДП) | 100.14 знаков |
Доля диалогов в тексте | 13.59 % |
Доля авторского текста | 86.41 % |
СДП диалогов | 75.05 знаков |
СДП авторского текста | 122.30 знаков |
|
Максимальный фрагмент авторского текста - 78333 знаков (в страницах - примерно 44, начинается где-то с 1 страницы) |
Активный словарный запас
Использовано уникальных слов | 40072 | |
Активный словарный запас (АСЗ) | 39604 | |
Активный не словарный запас (АНСЗ) | 468 | |
Удельный АСЗ на 3000 слов текста | 1615.32 | 123724 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4278.91 | 127207 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 23661.85 | 36574 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1815) наблюдается примерно на 309 странице |
Минимальный УАСЗ-3000 (1383) наблюдается примерно на 210 странице |
|
Буквы и знаки препинания
Всего букв | 1201541 букв |
Всего знаков препинания | 50219 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 29214 | 130.14 |
. | 12778 | 56.92 |
- | 2020 | 9.00 |
? | 1027 | 4.58 |
! | 1584 | 7.06 |
... | 0 | 0.00 |
!.. | 103 | 0.46 |
?.. | 51 | 0.23 |
!!! | 0 | 0.00 |
?! | 5 | 0.02 |
" | 0 | 0.00 |
() | 74 | 0.33 |
: | 1330 | 5.92 |
; | 2033 | 9.06 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 101513 | 8.45 |
Б | 20908 | 1.74 |
В | 55005 | 4.58 |
Г | 22301 | 1.86 |
Д | 36265 | 3.02 |
Е-Ё | 100035 | 8.33 |
Ж | 22301 | 1.86 |
З | 20816 | 1.73 |
И-Й | 93712 | 7.80 |
К | 39766 | 3.31 |
Л | 63018 | 5.24 |
М | 34943 | 2.91 |
Н | 75545 | 6.29 |
О | 131075 | 10.91 |
П | 33398 | 2.78 |
Р | 54806 | 4.56 |
С | 64225 | 5.35 |
Т | 71651 | 5.96 |
У | 35897 | 2.99 |
Ф | 1103 | 0.09 |
Х | 12228 | 1.02 |
Ц | 3946 | 0.33 |
Ч | 16606 | 1.38 |
Ш | 11880 | 0.99 |
Щ | 4468 | 0.37 |
Ь-Ъ | 25954 | 2.16 |
Ы | 22508 | 1.87 |
Э | 3919 | 0.33 |
Ю | 6607 | 0.55 |
Я | 24405 | 2.03 |
|
Части речи
Определенных частей речи (ОЧР) | 224182 слов |
Не определенных частей речи (НОЧР) | 296 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 61791 | 27.563 |
Глаг. | 21053 | 20.287 |
Мест.-сущ. | 21053 | 9.391 |
Предл. | 16282 | 10.703 |
Союз | 18059 | 8 |
Прилаг. | 16282 | 7.263 |
Нареч. | 11981 | 5.344 |
Местоим-прилаг. | 10211 | 4.555 |
Частица | 9442 | 4.212 |
Местоим. нареч. | 3262 | 1.455 |
Числит. | 1981 | 0.884 |
Числит-прилаг. | 408 | 0.182 |
Междомет. | 235 | 0.105 |
Часть комп. сложн. слова | 2 | 0.001 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 55.87 | 65.47 | 20.72 | 35.22 | 38.11 | 15.48 | 14.86 | 12.44 | 9.89 | 4.58 | 2.04 | 0.39 | 0.57 | 0.00 |
Глаг. | 45.46 | 23.97 | 22.25 | 43.35 | 19.77 | 15.18 | 11.66 | 8.43 | 7.60 | 3.08 | 1.62 | 0.31 | 0.20 | 0.00 |
Мест.-сущ. | 14.41 | 34.48 | 4.71 | 7.38 | 6.22 | 5.79 | 7.94 | 3.16 | 7.38 | 1.87 | 0.41 | 0.09 | 0.08 | 0.00 |
Предл. | 56.68 | 1.94 | 17.54 | 0.55 | 0.56 | 14.31 | 0.51 | 12.02 | 0.06 | 0.01 | 2.07 | 0.75 | 0.01 | 0.00 |
Союз | 15.84 | 17.33 | 11.87 | 7.07 | 3.02 | 5.01 | 6.91 | 3.86 | 6.80 | 2.27 | 0.49 | 0.08 | 0.01 | 0.00 |
Прилаг. | 50.53 | 4.70 | 1.70 | 2.48 | 4.29 | 5.61 | 1.03 | 1.11 | 0.72 | 0.27 | 0.13 | 0.01 | 0.04 | 0.00 |
Нареч. | 4.58 | 22.77 | 4.33 | 4.65 | 3.72 | 3.51 | 3.80 | 1.33 | 3.47 | 0.58 | 0.64 | 0.02 | 0.03 | 0.00 |
Местоим-прилаг. | 18.94 | 7.92 | 4.19 | 2.15 | 1.12 | 4.78 | 2.21 | 1.12 | 2.01 | 0.68 | 0.34 | 0.06 | 0.04 | 0.00 |
Частица | 4.67 | 19.81 | 3.91 | 2.84 | 1.86 | 1.77 | 2.58 | 1.39 | 2.10 | 0.84 | 0.31 | 0.02 | 0.01 | 0.00 |
Местоим. нареч. | 1.43 | 3.43 | 2.21 | 0.99 | 1.51 | 0.61 | 1.72 | 0.39 | 1.82 | 0.31 | 0.10 | 0.01 | 0.00 | 0.00 |
Числит. | 5.83 | 0.74 | 0.21 | 0.21 | 0.17 | 0.47 | 0.16 | 0.16 | 0.09 | 0.03 | 0.68 | 0.06 | 0.01 | 0.00 |
Числит-прилаг. | 1.20 | 0.19 | 0.04 | 0.10 | 0.06 | 0.07 | 0.03 | 0.01 | 0.10 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.18 | 0.12 | 0.22 | 0.03 | 0.15 | 0.04 | 0.03 | 0.14 | 0.07 | 0.02 | 0.00 | 0.00 | 0.05 | 0.00 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 20.91 | 20.62 | 24.85 | 25.23 | 27.55 |
Глаг. | 9.94 | 26.31 | 25.26 | 25.12 | 22.12 |
Мест.-сущ. | 14.42 | 12.59 | 10.08 | 9.95 | 8.91 |
Предл. | 11.29 | 7.18 | 9.93 | 11.30 | 11.17 |
Союз | 16.48 | 5.19 | 5.51 | 6.22 | 6.90 |
Прилаг. | 3.35 | 4.65 | 5.42 | 6.13 | 7.24 |
Нареч. | 8.62 | 7.95 | 6.33 | 5.20 | 5.32 |
Местоим-прилаг. | 3.89 | 5.23 | 4.21 | 3.74 | 4.24 |
Частица | 5.65 | 6.69 | 5.83 | 4.68 | 4.11 |
Местоим. нареч. | 3.44 | 1.91 | 1.52 | 1.19 | 1.18 |
Числит. | 0.81 | 1.11 | 0.85 | 0.98 | 1.02 |
Числит-прилаг. | 0.18 | 0.46 | 0.18 | 0.21 | 0.18 |
Междомет. | 1.02 | 0.10 | 0.03 | 0.04 | 0.07 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 26.91 | 28.18 | 26.61 | 26.97 | 26.68 |
Глаг. | 21.66 | 20.15 | 20.99 | 20.35 | 20.44 |
Мест.-сущ. | 8.61 | 8.51 | 8.69 | 8.78 | 9.28 |
Предл. | 11.06 | 11.13 | 11.09 | 11.30 | 11.90 |
Союз | 8.09 | 8.18 | 8.85 | 8.25 | 8.23 |
Прилаг. | 7.31 | 7.49 | 7.62 | 7.81 | 7.85 |
Нареч. | 5.23 | 5.23 | 4.80 | 5.05 | 4.76 |
Местоим-прилаг. | 4.69 | 4.68 | 4.65 | 4.67 | 4.86 |
Частица | 4.14 | 4.00 | 4.10 | 4.16 | 3.73 |
Местоим. нареч. | 1.21 | 1.23 | 1.32 | 1.42 | 1.20 |
Числит. | 0.86 | 0.98 | 1.11 | 0.98 | 0.87 |
Числит-прилаг. | 0.15 | 0.16 | 0.14 | 0.18 | 0.18 |
Междомет. | 0.07 | 0.05 | 0.03 | 0.05 | 0.01 |
Часть комп. сложн. слова | 0.00 | 0.03 | 0.00 | 0.02 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 27.07 | 27.60 | 27.49 | 25.46 | 26.33 |
Глаг. | 19.50 | 20.13 | 20.15 | 20.02 | 19.56 |
Мест.-сущ. | 9.06 | 8.29 | 9.11 | 9.06 | 9.01 |
Предл. | 12.25 | 11.31 | 11.16 | 12.22 | 12.46 |
Союз | 8.41 | 8.66 | 8.56 | 9.06 | 8.18 |
Прилаг. | 7.50 | 8.33 | 7.96 | 8.57 | 8.09 |
Нареч. | 5.22 | 4.74 | 4.63 | 4.55 | 5.24 |
Местоим-прилаг. | 4.52 | 4.73 | 4.66 | 4.58 | 4.84 |
Частица | 3.95 | 3.67 | 3.82 | 4.27 | 3.92 |
Местоим. нареч. | 1.26 | 1.31 | 1.51 | 1.12 | 1.20 |
Числит. | 0.98 | 0.94 | 0.81 | 0.88 | 1.05 |
Числит-прилаг. | 0.22 | 0.17 | 0.10 | 0.17 | 0.08 |
Междомет. | 0.07 | 0.07 | 0.03 | 0.05 | 0.02 |
Часть комп. сложн. слова | 0.00 | 0.05 | 0.03 | 0.00 | 0.03 |
Последние комментарии
5 часов 44 минут назад
5 часов 45 минут назад
11 часов 4 минут назад
14 часов 45 минут назад
15 часов 6 минут назад
16 часов 59 секунд назад