Лингвистический анализ: Утраченное Просвещение: Золотой век Центральной Азии от арабского завоевания до времен Тамерлана (Стивен Старр)


- Утраченное Просвещение: Золотой век Центральной Азии от арабского завоевания до времен Тамерлана 13.07 Мб, 764с. скачать: (fb2) (исправленную)  читать: (полностью)  - Стивен Фредерик Старр

Общая статистика

Длина текста1374660 знаков
Длина диалогов0 знаков
Слов в произведении (СВП)188059 слов
Приблизительно страниц764 стр.
Средняя длина слова5.87 знаков
Предложений в произведении (ПВП)12715 предл.
Средняя длина предложения (СДП)105.14 знаков
Доля диалогов в тексте0.00 %
Доля авторского текста100 %
СДП диалогов0.00 знаков
СДП авторского текста104.32 знаков

Активный словарный запас

Использовано уникальных слов33102
Активный словарный запас (АСЗ)27978
Активный не словарный запас (АНСЗ)5124
Удельный АСЗ на 3000 слов текста1569.12281643 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4097.44385103 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста21971.5965407 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 374761: Утраченное Просвещение: Золотой век Центральной Азии от арабского завоевания до времен Тамерлана (Стивен Старр)
Максимальный УАСЗ-3000 (1780) наблюдается примерно на 288 странице
Минимальный УАСЗ-3000 (1078) наблюдается примерно на 727 странице
Рост АСЗ книги № 374761: Утраченное Просвещение: Золотой век Центральной Азии от арабского завоевания до времен Тамерлана (Стивен Старр)

Буквы и знаки препинания

Всего букв1017701 букв
Всего знаков препинания39676 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 19741104.97
. 1354672.03
- 251513.37
? 2581.37
! 570.30
... 00.00
!.. 00.00
?.. 10.01
!!! 00.00
?! 10.01
" 110.06
() 17109.09
: 14547.73
; 3822.03
БукваКол-во (шт.)Частота использования (в %)
А837558.23
Б174211.71
В462984.55
Г185191.82
Д299172.94
Е-Ё825078.11
Ж185191.82
З176991.74
И-Й10423010.24
К331513.26
Л463894.56
М341653.36
Н679776.68
О10594810.41
П246222.42
Р512085.03
С554215.45
Т590725.80
У245612.41
Ф33720.33
Х137711.35
Ц54920.54
Ч129271.27
Ш57810.57
Щ32350.32
Ь-Ъ161471.59
Ы195061.92
Э35860.35
Ю57370.56
Я164921.62
Диаграма использования букв книги № 374761: Утраченное Просвещение: Золотой век Центральной Азии от арабского завоевания до времен Тамерлана (Стивен Старр)

Части речи

Определенных частей речи (ОЧР)170750 слов
Не определенных частей речи (НОЧР)17309 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.6297936.884
Глаг.854312.883
Мест.-сущ.85435.003
Предл.1931212.298
Союз146249
Прилаг.1931211.310
Нареч.66743.909
Местоим-прилаг.86235.050
Частица43852.568
Местоим. нареч.11470.672
Числит.9630.564
Числит-прилаг.3990.234
Междомет.460.027
Часть комп.
сложн. слова
590.035

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.97.9055.9414.3067.0353.7631.8115.6517.948.623.391.630.610.180.08
Глаг.32.2611.638.1229.359.3617.666.238.093.890.900.900.410.020.02
Мест.-сущ.12.9415.711.342.834.884.333.101.213.120.340.130.090.000.00
Предл.66.851.2312.011.421.0822.040.9513.950.280.411.660.860.040.19
Союз30.8511.066.856.913.5011.055.604.723.920.620.330.190.010.04
Прилаг.87.562.691.033.867.048.660.690.700.470.180.160.020.020.02
Нареч.3.6114.381.815.012.626.012.611.191.320.230.250.030.010.00
Местоим-прилаг.24.446.192.753.051.347.552.001.261.420.130.280.090.010.01
Частица6.358.391.002.860.832.101.421.141.000.360.200.020.000.00
Местоим. нареч.0.591.120.610.381.020.440.680.121.580.160.020.000.000.00
Числит.3.770.310.080.070.140.960.090.120.020.000.060.010.000.00
Числит-прилаг.1.350.150.150.150.070.320.050.050.010.010.020.010.000.00
Междомет.0.140.020.000.050.000.020.010.010.010.000.000.000.010.00
Часть комп.
сложн. слова
0.210.000.000.000.010.130.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.23.4136.6936.3238.1837.31
Глаг.5.5913.6316.3516.6315.79
Мест.-сущ.9.407.586.045.194.66
Предл.18.239.2410.0110.2211.32
Союз12.255.796.506.387.52
Прилаг.8.399.0810.3911.1911.48
Нареч.8.745.004.193.543.83
Местоим-прилаг.6.875.805.244.564.34
Частица2.765.263.482.842.52
Местоим. нареч.2.920.600.420.380.47
Числит.0.780.750.750.640.61
Числит-прилаг.0.620.570.260.200.11
Междомет.0.010.000.050.000.01
Часть комп.
сложн. слова
0.030.000.000.050.02

Номер слова в предложении
678910
Сущ.36.8436.5437.6636.1436.27
Глаг.15.4114.5214.2713.9913.78
Мест.-сущ.4.024.733.884.664.24
Предл.11.8111.9511.6512.8212.45
Союз8.278.289.098.778.51
Прилаг.11.7411.7611.7812.0412.26
Нареч.3.623.773.173.413.58
Местоим-прилаг.4.784.555.124.594.87
Частица2.222.532.092.152.50
Местоим. нареч.0.460.500.510.590.50
Числит.0.630.590.560.620.75
Числит-прилаг.0.170.230.170.220.23
Междомет.0.000.010.010.000.05
Часть комп.
сложн. слова
0.020.050.040.000.00

Номер слова в предложении
1112131415
Сущ.35.3836.8035.4134.8735.93
Глаг.13.2913.5213.2312.8013.18
Мест.-сущ.4.324.294.674.594.65
Предл.13.0812.6912.5412.8712.32
Союз9.168.919.239.898.87
Прилаг.11.8411.1112.4012.3612.61
Нареч.3.743.383.543.643.07
Местоим-прилаг.5.285.595.495.255.31
Частица2.572.242.352.282.46
Местоим. нареч.0.590.570.460.730.73
Числит.0.420.670.510.460.51
Числит-прилаг.0.180.160.130.240.26
Междомет.0.010.000.000.020.04
Часть комп.
сложн. слова
0.110.060.050.020.06