Лингвистический анализ: Из потаенной истории России XVIII–XIX веков (Натан Эйдельман)


- Из потаенной истории России XVIII–XIX веков 2.01 Мб, 531с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Натан Яковлевич Эйдельман

Общая статистика

Длина текста954624 знаков
Длина диалогов2584 знаков
Слов в произведении (СВП)132981 слов
Приблизительно страниц531 стр.
Средняя длина слова5.74 знаков
Предложений в произведении (ПВП)9704 предл.
Средняя длина предложения (СДП)95.42 знаков
Доля диалогов в тексте0.27 %
Доля авторского текста99.73 %
СДП диалогов151.06 знаков
СДП авторского текста98.60 знаков
Использование диалогов по тексту книги № 543127: Из потаенной истории России XVIII–XIX веков (Натан Эйдельман)
Максимальный фрагмент авторского текста - 304616 знаков (в страницах - примерно 169, начинается где-то с 127 страницы)

Активный словарный запас

Использовано уникальных слов28730
Активный словарный запас (АСЗ)27474
Активный не словарный запас (АНСЗ)1256
Удельный АСЗ на 3000 слов текста1616.11426873 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4288.91361500 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста23784.086566 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 543127: Из потаенной истории России XVIII–XIX веков (Натан Эйдельман)
Максимальный УАСЗ-3000 (1828) наблюдается примерно на 80 странице
Минимальный УАСЗ-3000 (1221) наблюдается примерно на 514 странице
Рост АСЗ книги № 543127: Из потаенной истории России XVIII–XIX веков (Натан Эйдельман)

Буквы и знаки препинания

Всего букв759791 букв
Всего знаков препинания30772 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 15713118.16
. 986474.18
- 144210.84
? 2762.08
! 2662.00
... 00.00
!.. 80.06
?.. 80.06
!!! 10.01
?! 20.02
" 00.00
() 10367.79
: 141510.64
; 7415.57
БукваКол-во (шт.)Частота использования (в %)
А589067.75
Б123481.63
В374924.93
Г145331.91
Д225162.96
Е-Ё688709.06
Ж145331.91
З118011.55
И-Й680548.96
К259843.42
Л315434.15
М237263.12
Н517746.81
О8102410.66
П226052.98
Р369904.87
С432715.70
Т443035.83
У183682.42
Ф18520.24
Х76271.00
Ц44210.58
Ч109221.44
Ш50900.67
Щ29890.39
Ь-Ъ115971.53
Ы138611.82
Э19020.25
Ю42310.56
Я145551.92
Диаграма использования букв книги № 543127: Из потаенной истории России XVIII–XIX веков (Натан Эйдельман)

Части речи

Определенных частей речи (ОЧР)131690 слов
Не определенных частей речи (НОЧР)1291 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4618835.073
Глаг.749513.733
Мест.-сущ.74955.691
Предл.1294411.791
Союз109958
Прилаг.129449.829
Нареч.68015.164
Местоим-прилаг.59224.497
Частица47983.643
Местоим. нареч.14461.098
Числит.8450.642
Числит-прилаг.5350.406
Междомет.630.048
Часть комп.
сложн. слова
460.035

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.110.1450.0614.0553.7743.4729.5118.1914.369.394.511.561.250.300.17
Глаг.30.4714.669.8930.7214.7012.738.826.435.581.851.060.350.080.00
Мест.-сущ.12.8615.112.634.594.334.674.842.034.650.790.240.130.020.02
Предл.63.661.8514.181.371.5317.771.1912.190.330.341.741.630.020.10
Союз23.2612.877.189.044.327.567.104.275.771.450.430.240.020.00
Прилаг.68.653.711.514.276.469.241.571.001.150.410.170.100.020.03
Нареч.5.7216.552.075.843.696.784.311.753.750.550.510.090.020.01
Местоим-прилаг.21.944.512.802.971.575.511.881.162.010.330.210.070.000.01
Частица5.6015.241.463.981.472.132.481.341.750.570.300.110.000.01
Местоим. нареч.0.932.210.950.911.601.001.030.241.890.130.040.040.000.01
Числит.4.570.280.060.210.110.700.140.080.060.050.140.020.000.00
Числит-прилаг.2.570.240.110.210.180.430.060.080.090.010.040.040.000.00
Междомет.0.260.040.020.020.050.020.020.050.010.000.000.000.000.00
Часть комп.
сложн. слова
0.090.000.000.000.000.250.010.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.40.1732.0833.1134.4335.33
Глаг.6.8915.8617.0816.2914.95
Мест.-сущ.5.557.195.925.524.93
Предл.15.3010.1510.7111.8212.59
Союз8.806.416.647.177.06
Прилаг.7.158.128.899.4210.23
Нареч.6.595.986.255.655.38
Местоим-прилаг.2.965.084.244.194.36
Частица2.826.235.013.283.03
Местоим. нареч.2.551.010.730.880.72
Числит.0.540.690.840.820.89
Числит-прилаг.0.571.160.510.400.48
Междомет.0.070.010.030.030.00
Часть комп.
сложн. слова
0.020.010.030.100.03

Номер слова в предложении
678910
Сущ.35.9334.0333.6535.5032.84
Глаг.13.9714.8415.5514.0914.46
Мест.-сущ.5.025.045.025.315.14
Предл.11.7011.6212.0611.4112.16
Союз7.458.128.057.788.05
Прилаг.10.3010.2810.8911.2511.53
Нареч.5.375.635.224.915.27
Местоим-прилаг.4.464.544.104.445.21
Частица3.723.683.113.243.40
Местоим. нареч.0.800.821.131.140.88
Числит.0.720.930.770.590.75
Числит-прилаг.0.420.420.400.280.26
Междомет.0.090.000.040.000.02
Часть комп.
сложн. слова
0.070.040.000.060.02

Номер слова в предложении
1112131415
Сущ.34.2833.9833.0734.2234.08
Глаг.14.3813.2614.1214.1612.89
Мест.-сущ.5.655.815.465.685.22
Предл.11.9010.9512.9011.5112.33
Союз8.628.457.687.378.19
Прилаг.10.6511.2910.3210.9411.57
Нареч.5.154.865.045.515.28
Местоим-прилаг.4.065.035.045.164.99
Частица3.194.154.343.443.70
Местоим. нареч.1.071.090.980.930.87
Числит.0.550.750.590.710.47
Числит-прилаг.0.430.270.340.330.41
Междомет.0.020.050.000.050.00
Часть комп.
сложн. слова
0.050.050.130.000.00