Лингвистический анализ: Китай (Эдвард Резерфорд)
Общая статистика
Длина текста | 1619834 знаков |
Длина диалогов | 706185 знаков |
Слов в произведении (СВП) | 247860 слов |
Приблизительно страниц | 900 стр. |
Средняя длина слова | 5.20 знаков |
Предложений в произведении (ПВП) | 27025 предл. |
Средняя длина предложения (СДП) | 57.07 знаков |
Доля диалогов в тексте | 43.60 % |
Доля авторского текста | 56.4 % |
СДП диалогов | 57.13 знаков |
СДП авторского текста | 80.07 знаков |
|
Максимальный фрагмент авторского текста - 7698 знаков (в страницах - примерно 4, начинается где-то с 634 страницы) |
Активный словарный запас
Использовано уникальных слов | 32260 | |
Активный словарный запас (АСЗ) | 31715 | |
Активный не словарный запас (АНСЗ) | 545 | |
Удельный АСЗ на 3000 слов текста | 1447.69 | 123724 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3685.52 | 127207 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 18599.30 | 36574 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1797) наблюдается примерно на 893 странице |
Минимальный УАСЗ-3000 (1226) наблюдается примерно на 428 странице |
|
Буквы и знаки препинания
Всего букв | 1289226 букв |
Всего знаков препинания | 56481 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 26440 | 106.67 |
. | 23454 | 94.63 |
- | 1830 | 7.38 |
? | 2536 | 10.23 |
! | 1024 | 4.13 |
... | 0 | 0.00 |
!.. | 2 | 0.01 |
?.. | 2 | 0.01 |
!!! | 0 | 0.00 |
?! | 72 | 0.29 |
" | 0 | 0.00 |
() | 48 | 0.19 |
: | 1019 | 4.11 |
; | 54 | 0.22 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 101076 | 7.84 |
Б | 21315 | 1.65 |
В | 52075 | 4.04 |
Г | 22650 | 1.76 |
Д | 41070 | 3.19 |
Е-Ё | 104777 | 8.13 |
Ж | 22650 | 1.76 |
З | 20647 | 1.60 |
И-Й | 101717 | 7.89 |
К | 40881 | 3.17 |
Л | 64549 | 5.01 |
М | 42534 | 3.30 |
Н | 89279 | 6.93 |
О | 148076 | 11.49 |
П | 36928 | 2.86 |
Р | 57056 | 4.43 |
С | 67007 | 5.20 |
Т | 80671 | 6.26 |
У | 36326 | 2.82 |
Ф | 1575 | 0.12 |
Х | 10728 | 0.83 |
Ц | 6054 | 0.47 |
Ч | 19765 | 1.53 |
Ш | 11031 | 0.86 |
Щ | 4263 | 0.33 |
Ь-Ъ | 26897 | 2.09 |
Ы | 24837 | 1.93 |
Э | 5589 | 0.43 |
Ю | 7394 | 0.57 |
Я | 27566 | 2.14 |
|
Части речи
Определенных частей речи (ОЧР) | 247494 слов |
Не определенных частей речи (НОЧР) | 366 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 62632 | 25.306 |
Глаг. | 28933 | 19.905 |
Мест.-сущ. | 28933 | 11.690 |
Предл. | 16772 | 9.709 |
Союз | 22630 | 9 |
Прилаг. | 16772 | 6.777 |
Нареч. | 14909 | 6.024 |
Местоим-прилаг. | 11113 | 4.490 |
Частица | 10836 | 4.378 |
Местоим. нареч. | 4133 | 1.670 |
Числит. | 1702 | 0.688 |
Числит-прилаг. | 384 | 0.155 |
Междомет. | 132 | 0.053 |
Часть комп. сложн. слова | 27 | 0.011 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 46.33 | 54.97 | 24.61 | 33.08 | 39.23 | 12.30 | 16.54 | 10.67 | 9.11 | 4.51 | 1.21 | 0.28 | 0.19 | 0.04 |
Глаг. | 42.91 | 22.85 | 27.54 | 35.13 | 22.75 | 13.58 | 12.55 | 9.01 | 7.90 | 3.02 | 1.48 | 0.24 | 0.09 | 0.00 |
Мест.-сущ. | 14.88 | 44.56 | 7.31 | 7.00 | 7.87 | 6.29 | 10.81 | 3.77 | 11.11 | 2.76 | 0.43 | 0.07 | 0.04 | 0.00 |
Предл. | 49.35 | 1.09 | 16.95 | 0.57 | 1.11 | 13.52 | 0.60 | 11.10 | 0.14 | 0.03 | 1.86 | 0.61 | 0.09 | 0.06 |
Союз | 15.14 | 18.30 | 21.05 | 7.07 | 4.41 | 4.25 | 6.87 | 4.32 | 6.17 | 3.16 | 0.52 | 0.11 | 0.06 | 0.00 |
Прилаг. | 46.72 | 4.13 | 2.17 | 2.20 | 4.84 | 4.85 | 1.00 | 0.73 | 0.66 | 0.29 | 0.15 | 0.03 | 0.00 | 0.00 |
Нареч. | 5.30 | 21.83 | 6.38 | 5.58 | 4.74 | 4.76 | 4.96 | 1.88 | 3.30 | 0.81 | 0.66 | 0.04 | 0.00 | 0.00 |
Местоим-прилаг. | 21.29 | 5.66 | 3.91 | 2.25 | 1.68 | 4.65 | 2.25 | 1.07 | 1.49 | 0.40 | 0.17 | 0.08 | 0.01 | 0.00 |
Частица | 4.11 | 21.04 | 4.02 | 2.89 | 1.78 | 1.99 | 2.76 | 1.74 | 1.93 | 1.37 | 0.13 | 0.02 | 0.02 | 0.00 |
Местоим. нареч. | 1.21 | 4.06 | 2.61 | 1.03 | 2.63 | 0.77 | 1.74 | 0.42 | 1.85 | 0.29 | 0.06 | 0.02 | 0.01 | 0.00 |
Числит. | 4.72 | 0.33 | 0.17 | 0.17 | 0.27 | 0.66 | 0.11 | 0.12 | 0.04 | 0.04 | 0.19 | 0.04 | 0.00 | 0.00 |
Числит-прилаг. | 0.99 | 0.11 | 0.10 | 0.07 | 0.06 | 0.08 | 0.02 | 0.03 | 0.05 | 0.01 | 0.02 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.10 | 0.10 | 0.08 | 0.03 | 0.07 | 0.03 | 0.02 | 0.04 | 0.04 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 |
Часть комп. сложн. слова | 0.04 | 0.02 | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 15.61 | 18.42 | 20.85 | 21.74 | 23.82 |
Глаг. | 10.67 | 26.68 | 25.92 | 23.15 | 21.27 |
Мест.-сущ. | 23.23 | 14.45 | 11.44 | 11.58 | 10.56 |
Предл. | 9.60 | 6.27 | 9.00 | 10.63 | 11.29 |
Союз | 16.17 | 5.36 | 6.93 | 8.19 | 8.88 |
Прилаг. | 4.07 | 5.36 | 6.16 | 7.40 | 7.71 |
Нареч. | 8.22 | 7.73 | 6.83 | 5.61 | 5.16 |
Местоим-прилаг. | 4.18 | 4.84 | 4.33 | 4.67 | 4.65 |
Частица | 4.68 | 7.56 | 6.08 | 4.63 | 4.26 |
Местоим. нареч. | 2.57 | 2.18 | 1.56 | 1.37 | 1.36 |
Числит. | 0.56 | 0.67 | 0.71 | 0.82 | 0.84 |
Числит-прилаг. | 0.19 | 0.38 | 0.14 | 0.11 | 0.14 |
Междомет. | 0.26 | 0.09 | 0.05 | 0.09 | 0.04 |
Часть комп. сложн. слова | 0.00 | 0.01 | 0.00 | 0.01 | 0.03 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 24.35 | 25.11 | 25.06 | 25.34 | 24.48 |
Глаг. | 20.28 | 18.91 | 19.07 | 19.24 | 18.30 |
Мест.-сущ. | 9.86 | 9.91 | 9.19 | 9.71 | 9.61 |
Предл. | 11.68 | 11.70 | 11.80 | 11.47 | 11.89 |
Союз | 9.37 | 9.53 | 9.88 | 9.58 | 10.39 |
Прилаг. | 7.75 | 8.11 | 8.15 | 7.97 | 8.16 |
Нареч. | 5.24 | 5.17 | 4.99 | 5.04 | 5.58 |
Местоим-прилаг. | 4.97 | 5.14 | 5.21 | 5.16 | 5.16 |
Частица | 3.95 | 3.95 | 4.13 | 3.89 | 4.19 |
Местоим. нареч. | 1.53 | 1.43 | 1.51 | 1.65 | 1.40 |
Числит. | 0.89 | 0.82 | 0.84 | 0.79 | 0.69 |
Числит-прилаг. | 0.10 | 0.16 | 0.15 | 0.13 | 0.11 |
Междомет. | 0.01 | 0.05 | 0.01 | 0.02 | 0.02 |
Часть комп. сложн. слова | 0.01 | 0.02 | 0.02 | 0.00 | 0.01 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 23.97 | 24.78 | 24.18 | 24.63 | 24.62 |
Глаг. | 19.45 | 19.03 | 18.93 | 18.19 | 17.31 |
Мест.-сущ. | 9.22 | 9.38 | 8.29 | 9.12 | 9.73 |
Предл. | 11.85 | 12.31 | 12.36 | 12.50 | 12.79 |
Союз | 10.10 | 9.81 | 9.45 | 9.95 | 9.28 |
Прилаг. | 8.43 | 8.25 | 8.81 | 8.46 | 9.18 |
Нареч. | 5.12 | 5.21 | 4.88 | 5.16 | 6.00 |
Местоим-прилаг. | 5.14 | 4.76 | 5.59 | 5.09 | 4.80 |
Частица | 4.39 | 4.22 | 4.83 | 4.43 | 4.05 |
Местоим. нареч. | 1.45 | 1.47 | 1.57 | 1.42 | 1.31 |
Числит. | 0.78 | 0.69 | 0.87 | 0.87 | 0.76 |
Числит-прилаг. | 0.08 | 0.07 | 0.17 | 0.12 | 0.08 |
Междомет. | 0.00 | 0.04 | 0.06 | 0.04 | 0.06 |
Часть комп. сложн. слова | 0.02 | 0.00 | 0.00 | 0.02 | 0.02 |
Последние комментарии
56 минут 25 секунд назад
57 минут 36 секунд назад
1 час 5 минут назад
1 час 9 минут назад
8 часов 51 минут назад
9 часов 31 минут назад