Лингвистический анализ: Царь всех болезней. Биография рака (Сиддхартха Мукерджи)
Общая статистика
Длина текста | 1127356 знаков |
Длина диалогов | 4480 знаков |
Слов в произведении (СВП) | 150586 слов |
Приблизительно страниц | 627 стр. |
Средняя длина слова | 6.21 знаков |
Предложений в произведении (ПВП) | 8844 предл. |
Средняя длина предложения (СДП) | 124.51 знаков |
Доля диалогов в тексте | 0.40 % |
Доля авторского текста | 99.6 % |
СДП диалогов | 57.96 знаков |
СДП авторского текста | 128.79 знаков |
|
Максимальный фрагмент авторского текста - 209318 знаков (в страницах - примерно 116, начинается где-то с 477 страницы) |
Активный словарный запас
Использовано уникальных слов | 33444 | |
Активный словарный запас (АСЗ) | 30912 | |
Активный не словарный запас (АНСЗ) | 2532 | |
Удельный АСЗ на 3000 слов текста | 1686.54 | 426873 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4550.16 | 361500 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 25424.77 | 6566 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1844) наблюдается примерно на 112 странице |
Минимальный УАСЗ-3000 (1470) наблюдается примерно на 491 странице |
|
Буквы и знаки препинания
Всего букв | 922704 букв |
Всего знаков препинания | 26849 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, | 14871 | 98.75 |
. | 8876 | 58.94 |
- | 1415 | 9.40 |
? | 280 | 1.86 |
! | 66 | 0.44 |
... | 0 | 0.00 |
!.. | 0 | 0.00 |
?.. | 4 | 0.03 |
!!! | 0 | 0.00 |
?! | 0 | 0.00 |
" | 0 | 0.00 |
() | 269 | 1.79 |
: | 989 | 6.57 |
; | 79 | 0.52 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 72222 | 7.83 |
Б | 14407 | 1.56 |
В | 38947 | 4.22 |
Г | 15404 | 1.67 |
Д | 26477 | 2.87 |
Е-Ё | 80176 | 8.69 |
Ж | 15404 | 1.67 |
З | 15113 | 1.64 |
И-Й | 88745 | 9.62 |
К | 33308 | 3.61 |
Л | 43657 | 4.73 |
М | 29383 | 3.18 |
Н | 63108 | 6.84 |
О | 97251 | 10.54 |
П | 26129 | 2.83 |
Р | 46652 | 5.06 |
С | 47377 | 5.13 |
Т | 54375 | 5.89 |
У | 21510 | 2.33 |
Ф | 3225 | 0.35 |
Х | 10687 | 1.16 |
Ц | 5834 | 0.63 |
Ч | 13673 | 1.48 |
Ш | 5121 | 0.55 |
Щ | 3588 | 0.39 |
Ь-Ъ | 15155 | 1.64 |
Ы | 18273 | 1.98 |
Э | 3088 | 0.33 |
Ю | 5857 | 0.63 |
Я | 16163 | 1.75 |
|
Части речи
Определенных частей речи (ОЧР) | 147942 слов |
Не определенных частей речи (НОЧР) | 2644 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Сущ. | 54961 | 37.150 |
Глаг. | 6077 | 14.454 |
Мест.-сущ. | 6077 | 4.108 |
Предл. | 17340 | 11.742 |
Союз | 10510 | 7 |
Прилаг. | 17340 | 11.721 |
Нареч. | 6498 | 4.392 |
Местоим-прилаг. | 6421 | 4.340 |
Частица | 3919 | 2.649 |
Местоим. нареч. | 1142 | 0.772 |
Числит. | 1764 | 1.192 |
Числит-прилаг. | 528 | 0.357 |
Междомет. | 16 | 0.011 |
Часть комп. сложн. слова | 10 | 0.007 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Сущ. | Глаг. | Мест.-сущ. | Предл. | Союз | Прилаг. | Нареч. | Местоим-прилаг. | Частица | Местоим. нареч. | Числит. | Числит-прилаг. | Междомет. | Часть комп. сложн. слова |
Сущ. | 109.18 | 67.73 | 12.38 | 60.76 | 40.08 | 36.53 | 17.50 | 13.05 | 7.64 | 2.98 | 2.37 | 1.22 | 0.05 | 0.03 |
Глаг. | 39.91 | 12.71 | 8.08 | 32.38 | 9.81 | 18.89 | 7.89 | 7.29 | 4.58 | 1.12 | 1.42 | 0.41 | 0.02 | 0.00 |
Мест.-сущ. | 8.94 | 12.43 | 1.08 | 2.94 | 3.87 | 3.45 | 3.05 | 1.54 | 2.93 | 0.47 | 0.24 | 0.11 | 0.01 | 0.01 |
Предл. | 65.20 | 1.83 | 8.99 | 0.64 | 0.57 | 21.05 | 1.15 | 12.63 | 0.16 | 0.11 | 3.89 | 1.18 | 0.01 | 0.01 |
Союз | 20.22 | 12.51 | 4.61 | 6.89 | 2.84 | 8.91 | 5.64 | 3.54 | 3.75 | 1.43 | 0.52 | 0.18 | 0.00 | 0.01 |
Прилаг. | 87.99 | 4.19 | 0.99 | 4.10 | 5.93 | 11.06 | 0.99 | 0.64 | 0.72 | 0.22 | 0.30 | 0.05 | 0.01 | 0.00 |
Нареч. | 3.41 | 16.73 | 1.58 | 3.67 | 3.64 | 6.25 | 3.18 | 1.69 | 2.49 | 0.41 | 0.82 | 0.05 | 0.00 | 0.00 |
Местоим-прилаг. | 21.75 | 3.62 | 1.80 | 2.49 | 1.49 | 6.38 | 1.78 | 1.10 | 1.91 | 0.47 | 0.41 | 0.18 | 0.01 | 0.01 |
Частица | 4.09 | 10.74 | 0.93 | 2.50 | 0.98 | 2.36 | 1.66 | 1.35 | 1.12 | 0.36 | 0.32 | 0.07 | 0.00 | 0.00 |
Местоим. нареч. | 0.82 | 1.51 | 0.51 | 0.35 | 1.37 | 0.86 | 0.88 | 0.26 | 1.02 | 0.14 | 0.01 | 0.00 | 0.00 | 0.00 |
Числит. | 7.40 | 0.29 | 0.08 | 0.51 | 0.35 | 1.12 | 0.15 | 0.28 | 0.04 | 0.01 | 1.57 | 0.11 | 0.00 | 0.00 |
Числит-прилаг. | 2.50 | 0.24 | 0.04 | 0.18 | 0.09 | 0.33 | 0.05 | 0.04 | 0.07 | 0.01 | 0.03 | 0.00 | 0.00 | 0.00 |
Междомет. | 0.03 | 0.01 | 0.00 | 0.01 | 0.00 | 0.01 | 0.00 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть комп. сложн. слова | 0.05 | 0.00 | 0.00 | 0.00 | 0.01 | 0.01 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Сущ. | 28.02 | 38.97 | 37.69 | 37.10 | 36.37 |
Глаг. | 6.45 | 18.76 | 17.76 | 17.68 | 17.02 |
Мест.-сущ. | 7.83 | 5.03 | 4.81 | 4.84 | 3.89 |
Предл. | 21.18 | 8.01 | 10.14 | 10.73 | 11.43 |
Союз | 12.16 | 4.52 | 6.02 | 5.77 | 5.74 |
Прилаг. | 8.02 | 8.48 | 9.40 | 10.74 | 12.21 |
Нареч. | 5.98 | 4.13 | 4.39 | 3.86 | 4.15 |
Местоим-прилаг. | 6.16 | 4.93 | 4.51 | 4.60 | 4.54 |
Частица | 1.82 | 3.88 | 2.98 | 2.75 | 2.53 |
Местоим. нареч. | 1.00 | 0.79 | 0.70 | 0.55 | 0.66 |
Числит. | 0.66 | 1.71 | 1.04 | 1.13 | 1.05 |
Числит-прилаг. | 0.72 | 0.75 | 0.54 | 0.20 | 0.38 |
Междомет. | 0.00 | 0.02 | 0.00 | 0.04 | 0.01 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.01 | 0.01 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Сущ. | 35.58 | 36.98 | 36.53 | 35.43 | 36.27 |
Глаг. | 17.77 | 15.42 | 15.75 | 15.17 | 13.77 |
Мест.-сущ. | 3.63 | 3.62 | 3.68 | 3.72 | 3.67 |
Предл. | 11.65 | 12.37 | 12.22 | 11.17 | 11.48 |
Союз | 6.10 | 6.15 | 6.94 | 7.69 | 7.86 |
Прилаг. | 12.54 | 12.86 | 11.80 | 13.65 | 12.48 |
Нареч. | 4.13 | 4.30 | 4.22 | 4.52 | 5.06 |
Местоим-прилаг. | 3.78 | 4.01 | 4.40 | 3.90 | 4.25 |
Частица | 2.61 | 2.26 | 2.16 | 2.26 | 2.96 |
Местоим. нареч. | 0.59 | 0.55 | 0.59 | 0.77 | 0.87 |
Числит. | 1.31 | 1.29 | 1.35 | 1.28 | 1.00 |
Числит-прилаг. | 0.27 | 0.19 | 0.34 | 0.41 | 0.34 |
Междомет. | 0.01 | 0.00 | 0.01 | 0.01 | 0.00 |
Часть комп. сложн. слова | 0.03 | 0.00 | 0.01 | 0.03 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Сущ. | 35.06 | 34.98 | 35.17 | 35.62 | 35.17 |
Глаг. | 14.54 | 14.11 | 14.50 | 14.04 | 13.67 |
Мест.-сущ. | 3.46 | 3.67 | 3.86 | 4.15 | 3.86 |
Предл. | 11.67 | 12.21 | 12.47 | 11.76 | 11.92 |
Союз | 7.63 | 8.05 | 7.27 | 7.90 | 8.03 |
Прилаг. | 13.55 | 12.88 | 13.10 | 12.67 | 12.77 |
Нареч. | 4.85 | 4.38 | 4.43 | 4.77 | 4.49 |
Местоим-прилаг. | 4.34 | 4.20 | 4.05 | 4.13 | 4.58 |
Частица | 2.76 | 3.00 | 2.65 | 2.80 | 3.10 |
Местоим. нареч. | 0.83 | 0.91 | 0.81 | 0.81 | 1.01 |
Числит. | 1.05 | 1.36 | 1.32 | 0.95 | 1.14 |
Числит-прилаг. | 0.25 | 0.25 | 0.33 | 0.35 | 0.25 |
Междомет. | 0.02 | 0.00 | 0.04 | 0.02 | 0.02 |
Часть комп. сложн. слова | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 |
Последние комментарии
5 часов 48 минут назад
5 часов 57 минут назад
12 часов 9 минут назад
12 часов 13 минут назад
12 часов 23 минут назад
12 часов 29 минут назад