Лингвистический анализ: «Титаник» (Милош Губачек)


- «Титаник» (пер. И. Мачульская) 4.72 Мб, 563с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Милош Губачек

Общая статистика

Длина текста1012869 знаков
Длина диалогов75758 знаков
Слов в произведении (СВП)145621 слов
Приблизительно страниц563 стр.
Средняя длина слова5.66 знаков
Предложений в произведении (ПВП)8828 предл.
Средняя длина предложения (СДП)111.79 знаков
Доля диалогов в тексте7.48 %
Доля авторского текста92.52 %
СДП диалогов87.40 знаков
СДП авторского текста113.12 знаков
Использование диалогов по тексту книги № 213146: «Титаник» (Милош Губачек)
Максимальный фрагмент авторского текста - 240880 знаков (в страницах - примерно 134, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов23084
Активный словарный запас (АСЗ)22219
Активный не словарный запас (АНСЗ)865
Удельный АСЗ на 3000 слов текста1450.79391875 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3629.21339599 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста18256.6949105 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 213146: «Титаник» (Милош Губачек)
Максимальный УАСЗ-3000 (1707) наблюдается примерно на 50 странице
Минимальный УАСЗ-3000 (1092) наблюдается примерно на 483 странице
Рост АСЗ книги № 213146: «Титаник» (Милош Губачек)

Буквы и знаки препинания

Всего букв823304 букв
Всего знаков препинания27125 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 15333105.29
. 915362.85
- 10717.35
? 3602.47
! 1871.28
... 00.00
!.. 40.03
?.. 10.01
!!! 00.00
?! 10.01
" 00.00
() 1040.71
: 8445.80
; 670.46
БукваКол-во (шт.)Частота использования (в %)
А672988.17
Б136711.66
В344434.18
Г124161.51
Д265923.23
Е-Ё633497.69
Ж124161.51
З113481.38
И-Й718898.73
К284933.46
Л424705.16
М250253.04
Н557226.77
О9174311.14
П262673.19
Р380404.62
С480005.83
Т511266.21
У214822.61
Ф21580.26
Х77500.94
Ц23890.29
Ч111581.36
Ш71080.86
Щ32340.39
Ь-Ъ147311.79
Ы158861.93
Э27950.34
Ю57000.69
Я134351.63
Диаграма использования букв книги № 213146: «Титаник» (Милош Губачек)

Части речи

Определенных частей речи (ОЧР)145012 слов
Не определенных частей речи (НОЧР)609 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4814133.198
Глаг.923017.257
Мест.-сущ.92306.365
Предл.1165612.012
Союз116488
Прилаг.116568.038
Нареч.69814.814
Местоим-прилаг.62924.339
Частица46363.197
Местоим. нареч.14430.995
Числит.16421.132
Числит-прилаг.8010.552
Междомет.370.026
Часть комп.
сложн. слова
610.042

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.94.6964.9616.0349.7440.8619.3815.9413.958.063.822.112.100.190.14
Глаг.40.5020.8511.2138.2717.3514.5711.497.086.561.701.931.000.030.05
Мест.-сущ.10.0324.722.574.625.123.054.761.425.731.100.350.160.010.00
Предл.66.022.3913.450.671.1118.100.8412.440.100.103.411.280.010.19
Союз20.0115.159.899.223.725.825.344.104.131.590.820.500.010.02
Прилаг.60.493.360.852.694.306.540.720.430.480.210.210.100.000.02
Нареч.4.4116.032.796.344.034.194.461.212.920.521.150.100.000.00
Местоим-прилаг.18.336.103.364.051.345.161.920.901.350.350.390.140.000.00
Частица3.9116.211.832.960.661.531.701.480.990.400.260.040.000.00
Местоим. нареч.1.192.141.370.861.230.480.700.191.540.140.080.030.010.00
Числит.8.000.400.140.370.341.080.190.130.040.020.550.050.000.00
Числит-прилаг.4.070.260.120.320.220.290.060.020.080.010.060.030.000.00
Междомет.0.140.010.010.010.040.000.000.050.000.000.000.000.000.00
Часть комп.
сложн. слова
0.210.000.000.010.000.180.030.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.24.2532.1531.5931.1333.73
Глаг.6.2221.7522.9820.1219.10
Мест.-сущ.12.9410.006.817.255.63
Предл.18.938.4310.7411.5212.41
Союз11.823.516.227.977.64
Прилаг.4.675.966.427.687.19
Нареч.8.535.394.814.824.53
Местоим-прилаг.4.765.104.063.903.92
Частица3.044.493.763.043.19
Местоим. нареч.2.740.980.660.650.83
Числит.0.911.571.101.321.26
Числит-прилаг.1.060.670.800.600.49
Междомет.0.090.000.010.010.03
Часть комп.
сложн. слова
0.030.010.010.000.05

Номер слова в предложении
678910
Сущ.32.5333.5333.2432.7532.66
Глаг.18.8317.5817.7417.7616.70
Мест.-сущ.5.705.275.225.326.08
Предл.11.7112.2012.3812.5512.05
Союз8.529.008.228.389.41
Прилаг.8.648.008.588.968.12
Нареч.4.464.164.884.354.48
Местоим-прилаг.4.354.354.334.204.43
Частица3.013.083.032.763.34
Местоим. нареч.0.761.010.641.051.00
Числит.1.011.121.001.101.15
Числит-прилаг.0.420.640.680.670.48
Междомет.0.030.000.000.090.05
Часть комп.
сложн. слова
0.040.060.060.060.05

Номер слова в предложении
1112131415
Сущ.32.6933.2631.8532.3031.90
Глаг.16.5417.0116.6717.5715.48
Мест.-сущ.5.215.894.905.635.64
Предл.12.4111.9413.2512.6113.21
Союз8.238.208.707.788.63
Прилаг.9.268.549.228.689.91
Нареч.4.474.214.344.594.39
Местоим-прилаг.4.704.544.864.834.41
Частица3.483.513.663.373.54
Местоим. нареч.1.111.090.881.151.11
Числит.1.311.301.150.861.21
Числит-прилаг.0.510.480.370.600.51
Междомет.0.050.020.020.000.02
Часть комп.
сложн. слова
0.020.020.120.040.02