Лингвистический анализ: Царь всех болезней. Биография рака (Сиддхартха Мукерджи)


- Царь всех болезней. Биография рака (пер. Мария Михайловна Виноградова) 2.12 Мб, 627с. скачать: (fb2) (исправленную)  читать: (полностью)  - Сиддхартха Мукерджи

Общая статистика

Длина текста1127356 знаков
Длина диалогов4480 знаков
Слов в произведении (СВП)150586 слов
Приблизительно страниц627 стр.
Средняя длина слова6.21 знаков
Предложений в произведении (ПВП)8844 предл.
Средняя длина предложения (СДП)124.51 знаков
Доля диалогов в тексте0.40 %
Доля авторского текста99.6 %
СДП диалогов57.96 знаков
СДП авторского текста128.79 знаков
Использование диалогов по тексту книги № 285687: Царь всех болезней. Биография рака (Сиддхартха Мукерджи)
Максимальный фрагмент авторского текста - 209318 знаков (в страницах - примерно 116, начинается где-то с 477 страницы)

Активный словарный запас

Использовано уникальных слов33444
Активный словарный запас (АСЗ)30912
Активный не словарный запас (АНСЗ)2532
Удельный АСЗ на 3000 слов текста1686.54426873 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4550.16361500 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста25424.776566 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 285687: Царь всех болезней. Биография рака (Сиддхартха Мукерджи)
Максимальный УАСЗ-3000 (1844) наблюдается примерно на 112 странице
Минимальный УАСЗ-3000 (1470) наблюдается примерно на 491 странице
Рост АСЗ книги № 285687: Царь всех болезней. Биография рака (Сиддхартха Мукерджи)

Буквы и знаки препинания

Всего букв922704 букв
Всего знаков препинания26849 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 1487198.75
. 887658.94
- 14159.40
? 2801.86
! 660.44
... 00.00
!.. 00.00
?.. 40.03
!!! 00.00
?! 00.00
" 00.00
() 2691.79
: 9896.57
; 790.52
БукваКол-во (шт.)Частота использования (в %)
А722227.83
Б144071.56
В389474.22
Г154041.67
Д264772.87
Е-Ё801768.69
Ж154041.67
З151131.64
И-Й887459.62
К333083.61
Л436574.73
М293833.18
Н631086.84
О9725110.54
П261292.83
Р466525.06
С473775.13
Т543755.89
У215102.33
Ф32250.35
Х106871.16
Ц58340.63
Ч136731.48
Ш51210.55
Щ35880.39
Ь-Ъ151551.64
Ы182731.98
Э30880.33
Ю58570.63
Я161631.75
Диаграма использования букв книги № 285687: Царь всех болезней. Биография рака (Сиддхартха Мукерджи)

Части речи

Определенных частей речи (ОЧР)147942 слов
Не определенных частей речи (НОЧР)2644 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.5496137.150
Глаг.607714.454
Мест.-сущ.60774.108
Предл.1734011.742
Союз105107
Прилаг.1734011.721
Нареч.64984.392
Местоим-прилаг.64214.340
Частица39192.649
Местоим. нареч.11420.772
Числит.17641.192
Числит-прилаг.5280.357
Междомет.160.011
Часть комп.
сложн. слова
100.007

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.109.1867.7312.3860.7640.0836.5317.5013.057.642.982.371.220.050.03
Глаг.39.9112.718.0832.389.8118.897.897.294.581.121.420.410.020.00
Мест.-сущ.8.9412.431.082.943.873.453.051.542.930.470.240.110.010.01
Предл.65.201.838.990.640.5721.051.1512.630.160.113.891.180.010.01
Союз20.2212.514.616.892.848.915.643.543.751.430.520.180.000.01
Прилаг.87.994.190.994.105.9311.060.990.640.720.220.300.050.010.00
Нареч.3.4116.731.583.673.646.253.181.692.490.410.820.050.000.00
Местоим-прилаг.21.753.621.802.491.496.381.781.101.910.470.410.180.010.01
Частица4.0910.740.932.500.982.361.661.351.120.360.320.070.000.00
Местоим. нареч.0.821.510.510.351.370.860.880.261.020.140.010.000.000.00
Числит.7.400.290.080.510.351.120.150.280.040.011.570.110.000.00
Числит-прилаг.2.500.240.040.180.090.330.050.040.070.010.030.000.000.00
Междомет.0.030.010.000.010.000.010.000.000.040.000.000.000.000.00
Часть комп.
сложн. слова
0.050.000.000.000.010.010.010.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.28.0238.9737.6937.1036.37
Глаг.6.4518.7617.7617.6817.02
Мест.-сущ.7.835.034.814.843.89
Предл.21.188.0110.1410.7311.43
Союз12.164.526.025.775.74
Прилаг.8.028.489.4010.7412.21
Нареч.5.984.134.393.864.15
Местоим-прилаг.6.164.934.514.604.54
Частица1.823.882.982.752.53
Местоим. нареч.1.000.790.700.550.66
Числит.0.661.711.041.131.05
Числит-прилаг.0.720.750.540.200.38
Междомет.0.000.020.000.040.01
Часть комп.
сложн. слова
0.000.000.010.010.00

Номер слова в предложении
678910
Сущ.35.5836.9836.5335.4336.27
Глаг.17.7715.4215.7515.1713.77
Мест.-сущ.3.633.623.683.723.67
Предл.11.6512.3712.2211.1711.48
Союз6.106.156.947.697.86
Прилаг.12.5412.8611.8013.6512.48
Нареч.4.134.304.224.525.06
Местоим-прилаг.3.784.014.403.904.25
Частица2.612.262.162.262.96
Местоим. нареч.0.590.550.590.770.87
Числит.1.311.291.351.281.00
Числит-прилаг.0.270.190.340.410.34
Междомет.0.010.000.010.010.00
Часть комп.
сложн. слова
0.030.000.010.030.00

Номер слова в предложении
1112131415
Сущ.35.0634.9835.1735.6235.17
Глаг.14.5414.1114.5014.0413.67
Мест.-сущ.3.463.673.864.153.86
Предл.11.6712.2112.4711.7611.92
Союз7.638.057.277.908.03
Прилаг.13.5512.8813.1012.6712.77
Нареч.4.854.384.434.774.49
Местоим-прилаг.4.344.204.054.134.58
Частица2.763.002.652.803.10
Местоим. нареч.0.830.910.810.811.01
Числит.1.051.361.320.951.14
Числит-прилаг.0.250.250.330.350.25
Междомет.0.020.000.040.020.02
Часть комп.
сложн. слова
0.000.000.000.020.00