Лингвистический анализ: Троецарствие (Ло Гуань-чжун)


- Троецарствие [1954 г. изд.] (пер. И. Миримский, ...) 3.03 Мб, 1645с. скачать: (fb2) (исправленную)  читать: (полностью)  - Ло Гуань-чжун

Общая статистика

Длина текста2960075 знаков
Длина диалогов1233534 знаков
Слов в произведении (СВП)483282 слов
Приблизительно страниц1645 стр.
Средняя длина слова4.85 знаков
Предложений в произведении (ПВП)35246 предл.
Средняя длина предложения (СДП)81.16 знаков
Доля диалогов в тексте41.67 %
Доля авторского текста58.33 %
СДП диалогов97.26 знаков
СДП авторского текста83.90 знаков
Использование диалогов по тексту книги № 143320: Троецарствие (Ло Гуань-чжун)
Максимальный фрагмент авторского текста - 53352 знаков (в страницах - примерно 30, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов35687
Активный словарный запас (АСЗ)33433
Активный не словарный запас (АНСЗ)2254
Удельный АСЗ на 3000 слов текста1323.87391875 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3273.97339599 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста14936.7249105 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 143320: Троецарствие (Ло Гуань-чжун)
Максимальный УАСЗ-3000 (1688) наблюдается примерно на 20 странице
Минимальный УАСЗ-3000 (762) наблюдается примерно на 1616 странице
Рост АСЗ книги № 143320: Троецарствие (Ло Гуань-чжун)

Буквы и знаки препинания

Всего букв2343525 букв
Всего знаков препинания91608 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 4094584.72
. 3300168.29
- 44599.23
? 30186.24
! 643913.32
... 00.00
!.. 990.20
?.. 70.01
!!! 00.00
?! 50.01
" 00.00
() 1060.22
: 29786.16
; 5511.14
БукваКол-во (шт.)Частота использования (в %)
А1915318.17
Б367851.57
В1139104.86
Г450621.92
Д683802.92
Е-Ё1660897.09
Ж450621.92
З421421.80
И-Й1926428.22
К623112.66
Л1131644.83
М645872.76
Н1635826.98
О24445310.43
П674232.88
Р920213.93
С1306085.57
Т1246895.32
У788963.37
Ф26700.11
Х229390.98
Ц222590.95
Ч400631.71
Ш199750.85
Щ52690.22
Ь-Ъ590922.52
Ы401771.71
Э193320.82
Ю243701.04
Я572142.44
Диаграма использования букв книги № 143320: Троецарствие (Ло Гуань-чжун)

Части речи

Определенных частей речи (ОЧР)469628 слов
Не определенных частей речи (НОЧР)13654 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.15941533.945
Глаг.3996720.430
Мест.-сущ.399678.510
Предл.2120910.389
Союз396968
Прилаг.212094.516
Нареч.182753.891
Местоим-прилаг.176083.749
Частица169653.612
Местоим. нареч.55951.191
Числит.33730.718
Числит-прилаг.10750.229
Междомет.14150.301
Часть комп.
сложн. слова
2990.064

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.111.5875.0117.0634.9749.7011.2212.509.389.863.991.540.751.770.13
Глаг.61.7124.4622.8343.8414.469.198.158.945.852.611.370.250.500.13
Мест.-сущ.14.1431.413.847.426.363.596.382.637.271.460.450.090.060.00
Предл.60.061.9516.970.581.209.600.309.560.360.052.090.780.110.28
Союз19.7823.5712.216.522.753.474.683.415.242.160.430.080.200.02
Прилаг.32.113.641.021.783.281.280.470.510.620.170.050.010.190.01
Нареч.4.3817.012.893.523.051.842.080.922.310.360.500.020.040.00
Местоим-прилаг.20.915.941.871.530.702.811.250.661.350.240.180.040.010.00
Частица5.5116.963.912.371.320.991.851.051.140.690.140.010.100.07
Местоим. нареч.1.642.872.230.781.100.470.910.271.460.140.040.010.010.00
Числит.5.200.160.090.090.070.370.040.090.470.000.370.240.000.00
Числит-прилаг.1.570.230.020.260.060.030.030.010.070.010.000.000.000.00
Междомет.0.661.030.150.220.440.080.160.070.130.040.010.010.030.00
Часть комп.
сложн. слова
0.190.050.010.010.050.220.110.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.25.4235.1227.4230.7635.61
Глаг.12.5318.5830.0125.0021.12
Мест.-сущ.13.2113.838.898.117.41
Предл.12.186.078.3011.8710.66
Союз12.783.905.366.347.99
Прилаг.2.524.113.894.834.86
Нареч.7.024.535.403.693.44
Местоим-прилаг.3.894.753.033.794.02
Частица5.495.554.923.472.65
Местоим. нареч.4.111.411.150.780.70
Числит.0.481.070.570.800.87
Числит-прилаг.0.160.410.570.240.22
Междомет.0.210.620.460.190.34
Часть комп.
сложн. слова
0.010.050.050.140.11

Номер слова в предложении
678910
Сущ.34.0034.4334.7233.9433.37
Глаг.21.5920.8520.4520.1420.45
Мест.-сущ.6.576.817.157.567.28
Предл.10.9511.1711.1511.4911.62
Союз10.119.8110.169.929.79
Прилаг.4.614.874.374.354.88
Нареч.3.373.323.053.443.30
Местоим-прилаг.3.843.543.593.763.88
Частица2.843.043.363.313.32
Местоим. нареч.0.760.820.880.930.86
Числит.0.760.820.660.670.77
Числит-прилаг.0.190.210.130.170.18
Междомет.0.270.260.290.270.26
Часть комп.
сложн. слова
0.120.050.040.050.04

Номер слова в предложении
1112131415
Сущ.33.3733.5733.0532.4433.04
Глаг.20.3220.2820.2220.0519.34
Мест.-сущ.7.737.757.987.988.17
Предл.11.3411.4311.4711.7611.55
Союз9.399.249.289.059.75
Прилаг.4.944.834.984.884.94
Нареч.3.263.233.393.353.22
Местоим-прилаг.3.763.973.814.244.11
Частица3.583.483.613.893.66
Местоим. нареч.1.031.051.121.141.03
Числит.0.770.620.660.690.61
Числит-прилаг.0.190.200.130.220.15
Междомет.0.260.250.240.280.34
Часть комп.
сложн. слова
0.060.100.050.030.08