Лингвистический анализ: Русский дух в стране самураев. Жизнь в Японии от первого лица (Дмитрий Шамов)


- Русский дух в стране самураев. Жизнь в Японии от первого лица 5.78 Мб, 148с. скачать: (fb2) (исправленную)  читать: (полностью)  - Дмитрий Шамов

Общая статистика

Длина текста265702 знаков
Длина диалогов171 знаков
Слов в произведении (СВП)40721 слов
Приблизительно страниц148 стр.
Средняя длина слова5.32 знаков
Предложений в произведении (ПВП)2362 предл.
Средняя длина предложения (СДП)109.51 знаков
Доля диалогов в тексте0.06 %
Доля авторского текста99.94 %
СДП диалогов56.33 знаков
СДП авторского текста113.38 знаков
Использование диалогов по тексту книги № 331665: Русский дух в стране самураев. Жизнь в Японии от первого лица (Дмитрий Шамов)
Максимальный фрагмент авторского текста - 100264 знаков (в страницах - примерно 56, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов9663
Активный словарный запас (АСЗ)9370
Активный не словарный запас (АНСЗ)293
Удельный АСЗ на 3000 слов текста1430.49413881 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3592.32362056 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 331665: Русский дух в стране самураев. Жизнь в Японии от первого лица (Дмитрий Шамов)
Максимальный УАСЗ-3000 (1520) наблюдается примерно на 29 странице
Минимальный УАСЗ-3000 (1341) наблюдается примерно на 94 странице
Рост АСЗ книги № 331665: Русский дух в стране самураев. Жизнь в Японии от первого лица (Дмитрий Шамов)

Буквы и знаки препинания

Всего букв215858 букв
Всего знаков препинания7255 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 4195103.02
. 235957.93
- 55813.70
? 140.34
! 190.47
... 00.00
!.. 00.00
?.. 10.02
!!! 00.00
?! 00.00
" 00.00
() 621.52
: 461.13
; 10.02
БукваКол-во (шт.)Частота использования (в %)
А164477.62
Б34191.58
В89624.15
Г30241.40
Д59702.77
Е-Ё173078.02
Ж30241.40
З36661.70
И-Й182308.45
К77763.60
Л89514.15
М72353.35
Н144446.69
О2500411.58
П69193.21
Р93094.31
С112395.21
Т142026.58
У57732.67
Ф4370.20
Х18810.87
Ц10250.47
Ч36111.67
Ш15790.73
Щ7140.33
Ь-Ъ43542.02
Ы42861.99
Э7110.33
Ю15810.73
Я56392.61
Диаграма использования букв книги № 331665: Русский дух в стране самураев. Жизнь в Японии от первого лица (Дмитрий Шамов)

Части речи

Определенных частей речи (ОЧР)40540 слов
Не определенных частей речи (НОЧР)181 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.1127627.815
Глаг.304716.707
Мест.-сущ.30477.516
Предл.281612.955
Союз36279
Прилаг.28166.946
Нареч.25846.374
Местоим-прилаг.24436.026
Частица16113.974
Местоим. нареч.5941.465
Числит.3150.777
Числит-прилаг.1830.451
Междомет.20.005
Часть комп.
сложн. слова
170.042

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.53.2644.8918.2555.4844.7012.9017.2915.698.515.401.090.570.000.10
Глаг.36.0119.6810.4637.3217.7612.5612.1110.046.542.171.700.640.000.07
Мест.-сущ.8.2629.453.954.665.603.778.312.427.181.210.270.070.000.00
Предл.67.981.5013.391.091.1617.272.1019.860.150.072.392.440.020.12
Союз14.5519.2414.2811.824.194.098.125.206.021.430.350.100.020.05
Прилаг.51.382.421.162.914.594.390.570.620.790.300.200.070.000.07
Нареч.4.9822.894.276.734.964.866.442.743.531.360.860.120.000.00
Местоим-прилаг.27.956.645.353.432.156.193.081.362.591.010.150.370.000.00
Частица4.0916.851.704.371.901.873.601.702.151.230.220.050.000.00
Местоим. нареч.1.112.812.051.132.000.761.780.392.200.390.020.000.000.00
Числит.5.250.200.120.350.320.540.270.150.020.020.470.050.000.00
Числит-прилаг.3.110.440.170.150.070.250.070.070.070.020.050.020.000.00
Междомет.0.000.020.000.020.000.000.000.000.000.000.000.000.000.00
Часть комп.
сложн. слова
0.170.020.000.100.070.000.000.020.000.020.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.15.3527.4427.4126.9930.55
Глаг.11.8720.3121.6018.6016.24
Мест.-сущ.13.919.098.368.928.61
Предл.20.8310.5311.3913.4012.29
Союз10.004.596.037.728.34
Прилаг.4.615.816.166.486.06
Нареч.10.356.826.736.135.20
Местоим-прилаг.7.176.866.034.886.01
Частица3.305.334.004.264.17
Местоим. нареч.1.781.271.191.241.03
Числит.0.260.870.570.980.85
Числит-прилаг.0.521.090.480.400.63
Междомет.0.000.000.000.000.00
Часть комп.
сложн. слова
0.040.000.040.000.00

Номер слова в предложении
678910
Сущ.27.7126.7727.7826.7925.83
Глаг.16.8316.4016.7217.3416.84
Мест.-сущ.6.787.815.966.206.65
Предл.13.1011.7113.2112.9913.57
Союз9.5111.2010.249.7010.55
Прилаг.8.147.306.736.757.74
Нареч.6.235.675.966.105.25
Местоим-прилаг.5.286.515.777.306.76
Частица3.093.623.703.553.95
Местоим. нареч.1.731.582.261.701.77
Числит.1.000.881.351.100.78
Числит-прилаг.0.450.460.340.500.21
Междомет.0.000.000.000.000.05
Часть комп.
сложн. слова
0.140.090.000.000.05

Номер слова в предложении
1112131415
Сущ.26.0023.5425.6424.6423.74
Глаг.17.0416.0314.6716.7717.56
Мест.-сущ.7.596.886.467.806.79
Предл.13.1113.2314.6113.1812.67
Союз11.4711.2510.4111.0410.53
Прилаг.7.157.058.407.668.17
Нареч.6.347.286.906.636.49
Местоим-прилаг.5.197.816.465.385.34
Частица3.774.083.764.425.50
Местоим. нареч.1.151.751.821.312.06
Числит.0.760.640.750.620.76
Числит-прилаг.0.440.350.130.480.38
Междомет.0.000.000.000.070.00
Часть комп.
сложн. слова
0.000.120.000.000.00