Лингвистический анализ: Северная Корея: вчера и сегодня (Андрей Ланьков)


- Северная Корея: вчера и сегодня 1.88 Мб, 354с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Андрей Николаевич Ланьков

Общая статистика

Длина текста637107 знаков
Длина диалогов156 знаков
Слов в произведении (СВП)88072 слов
Приблизительно страниц354 стр.
Средняя длина слова5.85 знаков
Предложений в произведении (ПВП)5894 предл.
Средняя длина предложения (СДП)105.10 знаков
Доля диалогов в тексте0.02 %
Доля авторского текста99.98 %
СДП диалогов51.33 знаков
СДП авторского текста101.91 знаков
Использование диалогов по тексту книги № 182213: Северная Корея: вчера и сегодня (Андрей Ланьков)
Максимальный фрагмент авторского текста - 550387 знаков (в страницах - примерно 306, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов17197
Активный словарный запас (АСЗ)16386
Активный не словарный запас (АНСЗ)811
Удельный АСЗ на 3000 слов текста1474.85252552 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3719.36256212 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 182213: Северная Корея: вчера и сегодня (Андрей Ланьков)
Максимальный УАСЗ-3000 (1648) наблюдается примерно на 269 странице
Минимальный УАСЗ-3000 (1187) наблюдается примерно на 322 странице
Рост АСЗ книги № 182213: Северная Корея: вчера и сегодня (Андрей Ланьков)

Буквы и знаки препинания

Всего букв512784 букв
Всего знаков препинания16985 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 836995.02
. 627571.25
- 102711.66
? 470.53
! 340.39
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 00.00
" 00.00
() 7508.52
: 4044.59
; 790.90
БукваКол-во (шт.)Частота использования (в %)
А367857.17
Б71951.40
В249094.86
Г86551.69
Д138502.70
Е-Ё447358.72
Ж86551.69
З68111.33
И-Й490639.57
К206944.04
Л199213.88
М162413.17
Н353586.90
О5799611.31
П142302.78
Р256375.00
С304985.95
Т298455.82
У102312.00
Ф11970.23
Х67171.31
Ц31610.62
Ч72861.42
Ш28090.55
Щ16220.32
Ь-Ъ86981.70
Ы98201.92
Э15620.30
Ю32750.64
Я95781.87
Диаграма использования букв книги № 182213: Северная Корея: вчера и сегодня (Андрей Ланьков)

Части речи

Определенных частей речи (ОЧР)86636 слов
Не определенных частей речи (НОЧР)1436 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.3221237.181
Глаг.347512.179
Мест.-сущ.34754.011
Предл.1062312.656
Союз62997
Прилаг.1062312.262
Нареч.43895.066
Местоим-прилаг.38994.500
Частица24382.814
Местоим. нареч.8600.993
Числит.3600.416
Числит-прилаг.4360.503
Междомет.830.096
Часть комп.
сложн. слова
460.053

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.122.8948.9410.4161.1138.7638.7119.0316.397.504.440.921.720.800.17
Глаг.23.7414.515.3030.849.8115.189.355.174.801.620.930.430.050.06
Мест.-сущ.10.959.461.063.004.263.563.310.773.070.480.070.080.010.01
Предл.67.892.6712.031.450.7723.221.2413.330.390.180.972.260.010.13
Союз18.3610.104.679.664.289.226.734.143.830.970.350.270.050.07
Прилаг.92.222.550.884.565.9113.561.080.580.600.400.100.070.000.09
Нареч.4.1715.221.846.863.928.374.361.663.340.570.350.010.000.00
Местоим-прилаг.20.145.702.203.881.545.881.971.241.640.570.170.080.000.00
Частица3.9610.150.933.600.912.182.441.391.720.590.200.070.010.00
Местоим. нареч.0.831.940.651.152.141.040.800.151.100.070.050.020.000.00
Числит.2.490.150.060.140.200.690.220.100.020.030.050.000.000.00
Числит-прилаг.3.520.270.060.250.140.550.090.060.080.000.000.010.000.00
Междомет.0.510.130.020.060.070.020.030.020.050.000.000.010.030.00
Часть комп.
сложн. слова
0.100.000.000.000.000.430.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.28.3337.1341.4238.0138.69
Глаг.7.8811.2813.6215.6915.16
Мест.-сущ.4.427.564.703.783.87
Предл.23.2411.8811.2811.8512.12
Союз8.564.284.996.255.59
Прилаг.7.289.9910.0311.1512.07
Нареч.10.225.004.644.944.47
Местоим-прилаг.4.366.413.904.384.09
Частица2.383.923.232.382.37
Местоим. нареч.2.220.660.620.540.60
Числит.0.280.420.400.510.34
Числит-прилаг.0.761.400.800.440.48
Междомет.0.040.040.290.050.12
Часть комп.
сложн. слова
0.020.040.070.020.02

Номер слова в предложении
678910
Сущ.36.7237.3436.2135.7736.51
Глаг.13.8913.8411.7413.4712.97
Мест.-сущ.3.773.803.133.553.77
Предл.12.2612.6113.4012.0312.33
Союз7.266.888.137.646.53
Прилаг.12.6412.2212.2613.0514.45
Нареч.4.174.984.974.764.47
Местоим-прилаг.4.404.274.925.054.53
Частица2.912.422.852.402.85
Местоим. нареч.0.930.811.170.900.56
Числит.0.450.440.630.480.50
Числит-прилаг.0.480.310.330.700.41
Междомет.0.080.050.190.060.09
Часть комп.
сложн. слова
0.050.030.080.140.03

Номер слова в предложении
1112131415
Сущ.35.1834.5735.9933.3534.33
Глаг.11.8012.1111.5812.8912.29
Мест.-сущ.3.763.224.234.174.38
Предл.13.0113.9513.1213.0812.65
Союз8.178.047.597.307.40
Прилаг.13.1913.8512.9114.0113.33
Нареч.5.534.605.185.105.61
Местоим-прилаг.4.724.834.445.595.25
Частица2.762.592.872.502.94
Местоим. нареч.0.871.381.261.231.03
Числит.0.560.460.350.370.40
Числит-прилаг.0.370.390.490.370.24
Междомет.0.060.000.000.000.04
Часть комп.
сложн. слова
0.030.000.000.040.12