Лингвистический анализ: Оливер Твист (Чарльз Диккенс)


- Оливер Твист (пер. М. П. Волошинова, ...) (и.с. Бесплатное приложение к журналу «Природа и люди») 1.61 Мб, 495с. скачать: (fb2) - (исправленную)  читать: (полностью) - (постранично) - Чарльз Диккенс

Общая статистика

Длина текста889772 знаков
Длина диалогов405592 знаков
Слов в произведении (СВП)145568 слов
Приблизительно страниц495 стр.
Средняя длина слова4.79 знаков
Предложений в произведении (ПВП)7692 предл.
Средняя длина предложения (СДП)112.90 знаков
Доля диалогов в тексте45.58 %
Доля авторского текста54.42 %
СДП диалогов97.76 знаков
СДП авторского текста156.72 знаков
Использование диалогов по тексту книги № 275052: Оливер Твист (Чарльз Диккенс)
Максимальный фрагмент авторского текста - 13025 знаков (в страницах - примерно 7, начинается где-то с 504 страницы)

Активный словарный запас

Использовано уникальных слов21534
Активный словарный запас (АСЗ)18739
Активный не словарный запас (АНСЗ)2795
Удельный АСЗ на 3000 слов текста1351.03391875 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3379.22339599 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста16979.2249105 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 275052: Оливер Твист (Чарльз Диккенс)
Максимальный УАСЗ-3000 (1476) наблюдается примерно на 275 странице
Минимальный УАСЗ-3000 (1211) наблюдается примерно на 217 странице
Рост АСЗ книги № 275052: Оливер Твист (Чарльз Диккенс)

Буквы и знаки препинания

Всего букв697594 букв
Всего знаков препинания28800 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 17196118.13
. 704848.42
- 6554.50
? 11457.87
! 165311.36
... 00.00
!.. 550.38
?.. 140.10
!!! 00.00
?! 20.01
" 00.00
() 540.37
: 3362.31
; 6424.41
БукваКол-во (шт.)Частота использования (в %)
А523527.50
Б125631.80
В295084.23
Г124921.79
Д215693.09
Е-Ё433346.21
Ж124921.79
З116551.67
И-Й502597.20
К230293.30
Л351795.04
М232963.34
Н417895.99
О7576010.86
П169712.43
Р298914.28
С371185.32
Т421456.04
У191932.75
Ф7530.11
Х52820.76
Ц18080.26
Ч103761.49
Ш58950.85
Щ21630.31
Ь-Ъ521467.48
Ы126471.81
Э28460.41
Ю37440.54
Я145842.09
Диаграма использования букв книги № 275052: Оливер Твист (Чарльз Диккенс)

Части речи

Определенных частей речи (ОЧР)141759 слов
Не определенных частей речи (НОЧР)3809 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.4538632.016
Глаг.1520417.083
Мест.-сущ.1520410.725
Предл.81299.336
Союз125819
Прилаг.81295.734
Нареч.69404.896
Местоим-прилаг.65964.653
Частица62234.390
Местоим. нареч.19471.373
Числит.7610.537
Числит-прилаг.1630.115
Междомет.3780.267
Часть комп.
сложн. слова
10.001

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.107.9652.0526.1932.0342.2513.0813.7614.5011.313.242.240.301.230.00
Глаг.47.1917.5522.7630.7914.658.4210.367.677.552.610.620.220.420.00
Мест.-сущ.21.9430.707.099.149.225.747.923.298.972.640.370.040.200.00
Предл.43.264.6617.661.311.429.391.0912.450.710.170.800.360.070.01
Союз19.1518.6216.696.933.825.235.383.286.672.280.550.100.040.00
Прилаг.36.355.402.492.354.963.290.680.730.680.330.030.020.030.00
Нареч.9.2715.803.174.044.943.343.651.032.990.470.180.010.060.00
Местоим-прилаг.20.826.633.982.141.755.701.541.161.810.790.100.040.060.00
Частица8.6815.984.733.292.141.862.911.741.460.860.160.020.060.00
Местоим. нареч.1.802.391.860.852.610.801.400.351.410.220.040.000.010.00
Числит.2.710.440.310.300.520.320.150.140.130.060.280.010.000.00
Числит-прилаг.0.640.160.040.040.080.040.040.020.060.010.000.020.000.00
Междомет.0.390.440.280.160.370.120.060.160.150.060.000.000.490.00
Часть комп.
сложн. слова
0.010.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.22.7926.8832.0432.8635.51
Глаг.11.3622.3821.3320.5419.12
Мест.-сущ.18.0712.8611.2610.929.70
Предл.8.926.017.688.609.05
Союз14.124.795.696.487.37
Прилаг.3.513.834.405.325.68
Нареч.5.436.726.045.224.83
Местоим-прилаг.3.245.343.844.003.81
Частица6.968.095.404.033.35
Местоим. нареч.2.921.931.371.220.96
Числит.0.540.460.470.490.51
Числит-прилаг.0.110.120.100.130.06
Междомет.2.040.580.390.180.05
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.35.3234.2133.9333.7333.38
Глаг.18.0518.0916.8718.2116.33
Мест.-сущ.9.449.789.198.889.77
Предл.8.628.1910.279.2310.18
Союз8.688.679.648.939.37
Прилаг.5.526.285.655.975.52
Нареч.4.164.634.335.054.87
Местоим-прилаг.4.734.514.424.394.48
Частица3.373.803.493.834.14
Местоим. нареч.1.291.111.311.141.09
Числит.0.530.490.730.430.59
Числит-прилаг.0.110.150.090.130.12
Междомет.0.160.090.090.060.16
Часть комп.
сложн. слова
0.000.000.000.020.00

Номер слова в предложении
1112131415
Сущ.31.6232.2431.5730.7431.91
Глаг.16.7916.4417.2016.3116.06
Мест.-сущ.9.6310.3710.3310.1410.29
Предл.10.0110.559.5110.5110.37
Союз10.519.319.3210.319.17
Прилаг.5.755.476.075.266.53
Нареч.4.744.504.935.085.35
Местоим-прилаг.4.784.924.564.914.10
Частица4.263.934.394.494.00
Местоим. нареч.1.171.461.361.411.44
Числит.0.400.510.580.620.57
Числит-прилаг.0.040.130.050.050.13
Междомет.0.290.150.140.170.08
Часть комп.
сложн. слова
0.000.000.000.000.00