Лингвистический анализ: Воспоминания русского дипломата (Григорий Трубецкой)


- Воспоминания русского дипломата [litres] 10.21 Мб, 1010с. скачать: (fb2) (исправленную)  читать: (полностью)  - Григорий Николаевич Трубецкой

Общая статистика

Длина текста1816964 знаков
Длина диалогов14810 знаков
Слов в произведении (СВП)263114 слов
Приблизительно страниц1010 стр.
Средняя длина слова5.64 знаков
Предложений в произведении (ПВП)17222 предл.
Средняя длина предложения (СДП)102.52 знаков
Доля диалогов в тексте0.82 %
Доля авторского текста99.18 %
СДП диалогов118.44 знаков
СДП авторского текста106.13 знаков
Использование диалогов по тексту книги № 555497: Воспоминания русского дипломата (Григорий Трубецкой)
Максимальный фрагмент авторского текста - 507681 знаков (в страницах - примерно 282, начинается где-то с 12 страницы)

Активный словарный запас

Использовано уникальных слов43680
Активный словарный запас (АСЗ)41496
Активный не словарный запас (АНСЗ)2184
Удельный АСЗ на 3000 слов текста1563.02413881 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4122.90362056 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста23017.5357549 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 555497: Воспоминания русского дипломата (Григорий Трубецкой)
Максимальный УАСЗ-3000 (1746) наблюдается примерно на 280 странице
Минимальный УАСЗ-3000 (1384) наблюдается примерно на 829 странице
Рост АСЗ книги № 555497: Воспоминания русского дипломата (Григорий Трубецкой)

Буквы и знаки препинания

Всего букв1479416 букв
Всего знаков препинания48818 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 27335103.89
. 1719765.36
- 18777.13
? 2100.80
! 1210.46
... 00.00
!.. 30.01
?.. 20.01
!!! 00.00
?! 50.02
" 00.00
() 7122.71
: 8343.17
; 5221.98
БукваКол-во (шт.)Частота использования (в %)
А1109257.50
Б286081.93
В713814.82
Г272901.84
Д433942.93
Е-Ё1276238.63
Ж272901.84
З215281.46
И-Й1322558.94
К478203.23
Л687284.65
М491673.32
Н988716.68
О16762911.33
П382972.59
Р714674.83
С855005.78
Т814625.51
У345482.34
Ф30020.20
Х137940.93
Ц69440.47
Ч202181.37
Ш113180.77
Щ47340.32
Ь-Ъ265301.79
Ы293961.99
Э42430.29
Ю91000.62
Я298022.01
Диаграма использования букв книги № 555497: Воспоминания русского дипломата (Григорий Трубецкой)

Части речи

Определенных частей речи (ОЧР)261964 слов
Не определенных частей речи (НОЧР)1150 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.8204831.320
Глаг.2092715.741
Мест.-сущ.209277.989
Предл.2538012.249
Союз210618
Прилаг.253809.688
Нареч.120824.612
Местоим-прилаг.143965.495
Частица78442.994
Местоим. нареч.32231.230
Числит.10270.392
Числит-прилаг.5310.203
Междомет.400.015
Часть комп.
сложн. слова
810.031

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.78.0149.0920.2754.5642.2525.7312.6617.686.614.680.920.550.070.12
Глаг.31.9618.1013.5435.2313.8216.1310.259.805.222.180.860.270.020.04
Мест.-сущ.14.3129.243.536.235.544.716.602.345.791.290.220.060.010.00
Предл.64.181.4720.390.440.7917.180.8215.320.090.060.960.770.000.05
Союз18.3814.0910.249.083.697.715.764.354.592.030.330.100.010.01
Прилаг.67.384.331.854.266.349.331.091.210.550.390.050.050.010.03
Нареч.4.3016.142.415.613.396.093.751.302.430.450.200.030.000.00
Местоим-прилаг.25.647.334.543.031.506.631.851.592.020.580.130.110.000.01
Частица3.7413.961.512.951.131.902.020.961.150.400.130.050.020.05
Местоим. нареч.1.073.261.440.951.750.731.190.291.350.210.030.010.000.00
Числит.2.670.260.100.100.100.420.100.050.050.010.060.010.000.00
Числит-прилаг.1.370.120.040.050.060.160.030.040.110.010.030.010.000.00
Междомет.0.070.010.010.000.020.000.010.020.000.000.000.000.000.00
Часть комп.
сложн. слова
0.120.010.000.000.020.150.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.24.4226.7727.7928.4230.25
Глаг.7.0822.9223.0019.8818.08
Мест.-сущ.16.2312.848.558.516.89
Предл.19.727.8410.9311.5512.12
Союз8.013.805.276.357.11
Прилаг.6.277.138.5910.6310.71
Нареч.6.605.835.825.245.02
Местоим-прилаг.6.076.834.774.625.12
Частица2.123.993.522.872.75
Местоим. нареч.2.541.131.081.031.10
Числит.0.450.400.370.610.53
Числит-прилаг.0.410.450.290.220.28
Междомет.0.060.010.010.010.00
Часть комп.
сложн. слова
0.010.040.030.050.03

Номер слова в предложении
678910
Сущ.30.7130.6330.7829.9930.42
Глаг.16.3415.5114.9815.5115.09
Мест.-сущ.6.716.726.446.406.73
Предл.12.3612.6512.6613.1612.16
Союз7.938.959.249.219.42
Прилаг.11.3610.9410.9510.9511.12
Нареч.4.614.084.384.194.18
Местоим-прилаг.5.195.695.645.665.77
Частица2.812.922.913.173.28
Местоим. нареч.1.051.231.301.071.17
Числит.0.560.430.480.430.44
Числит-прилаг.0.280.190.200.220.20
Междомет.0.010.000.010.000.00
Часть комп.
сложн. слова
0.060.070.030.030.03

Номер слова в предложении
1112131415
Сущ.29.9329.0829.1729.6828.85
Глаг.15.1515.5215.0514.8714.93
Мест.-сущ.6.637.107.467.727.13
Предл.13.1713.2612.7912.6213.44
Союз9.269.168.819.209.55
Прилаг.10.9310.8011.4010.5310.72
Нареч.4.304.164.554.284.47
Местоим-прилаг.5.706.015.526.035.96
Частица3.102.953.273.233.30
Местоим. нареч.1.241.391.321.351.18
Числит.0.400.400.470.360.36
Числит-прилаг.0.110.130.180.110.12
Междомет.0.020.010.000.010.00
Часть комп.
сложн. слова
0.050.030.020.000.00