Лингвистический анализ: Гарри Поттер. Полная коллекция (Джоан Роулинг)


- Гарри Поттер. Полная коллекция (пер. Мария Викторовна Спивак) 16.6 Мб, 3118с. скачать: (fb2) (исправленную)  читать: (полностью)  - Джоан Кэтлин Роулинг

Общая статистика

Длина текста5610953 знаков
Длина диалогов2938994 знаков
Слов в произведении (СВП)841678 слов
Приблизительно страниц3118 стр.
Средняя длина слова5.25 знаков
Предложений в произведении (ПВП)66291 предл.
Средняя длина предложения (СДП)81.84 знаков
Доля диалогов в тексте52.38 %
Доля авторского текста47.62 %
СДП диалогов81.25 знаков
СДП авторского текста92.36 знаков
Использование диалогов по тексту книги № 380837: Гарри Поттер. Полная коллекция (Джоан Роулинг)
Максимальный фрагмент авторского текста - 21192 знаков (в страницах - примерно 12, начинается где-то с 2844 страницы)

Активный словарный запас

Использовано уникальных слов69597
Активный словарный запас (АСЗ)65570
Активный не словарный запас (АНСЗ)4027
Удельный АСЗ на 3000 слов текста1491.79403729 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3876.43350125 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста19997.9429357 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 380837: Гарри Поттер. Полная коллекция (Джоан Роулинг)
Максимальный УАСЗ-3000 (1757) наблюдается примерно на 2581 странице
Минимальный УАСЗ-3000 (1269) наблюдается примерно на 1722 странице
Рост АСЗ книги № 380837: Гарри Поттер. Полная коллекция (Джоан Роулинг)

Буквы и знаки препинания

Всего букв4420787 букв
Всего знаков препинания205406 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 102699122.02
. 6380375.80
- 1014312.05
? 1069612.71
! 938011.14
... 00.00
!.. 2160.26
?.. 3870.46
!!! 80.01
?! 2410.29
" 00.00
() 3950.47
: 48905.81
; 25483.03
БукваКол-во (шт.)Частота использования (в %)
А3657098.27
Б708531.60
В1774844.01
Г999052.26
Д1403333.17
Е-Ё3421337.74
Ж999052.26
З850431.92
И-Й3503187.92
К1418153.21
Л2491155.64
М1409233.19
Н2821146.38
О48580310.99
П1300612.94
Р2500925.66
С2312865.23
Т2462135.57
У1343373.04
Ф123940.28
Х347420.79
Ц131690.30
Ч644351.46
Ш377820.85
Щ136310.31
Ь-Ъ873981.98
Ы720531.63
Э113570.26
Ю216550.49
Я886572.01
Диаграма использования букв книги № 380837: Гарри Поттер. Полная коллекция (Джоан Роулинг)

Части речи

Определенных частей речи (ОЧР)841031 слов
Не определенных частей речи (НОЧР)647 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.23350027.764
Глаг.7898320.764
Мест.-сущ.789839.391
Предл.4873710.167
Союз728149
Прилаг.487375.795
Нареч.581286.912
Местоим-прилаг.276183.284
Частица395814.706
Местоим. нареч.136701.625
Числит.46900.558
Числит-прилаг.17130.204
Междомет.14420.171
Часть комп.
сложн. слова
160.002

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.60.9465.0520.2433.2538.9510.7921.858.1711.414.471.270.600.660.00
Глаг.60.9722.4320.6839.0222.1511.7512.835.967.283.100.910.290.270.00
Мест.-сущ.10.9432.006.427.605.894.5010.082.7910.462.570.480.090.100.00
Предл.59.081.9114.761.441.1912.360.827.860.190.061.260.700.030.01
Союз17.2518.7615.546.793.783.368.213.406.052.950.330.080.080.00
Прилаг.37.954.761.601.873.595.101.260.520.790.260.190.010.040.00
Нареч.5.9529.855.125.385.064.146.381.484.340.910.400.050.050.00
Местоим-прилаг.13.485.432.801.711.222.902.270.821.490.390.230.060.030.00
Частица4.5722.693.823.212.321.823.331.322.731.020.180.030.040.00
Местоим. нареч.1.603.872.541.041.870.591.740.392.060.470.040.010.020.00
Числит.3.150.510.160.210.300.490.210.090.060.020.280.100.000.00
Числит-прилаг.1.400.160.060.090.080.100.040.020.060.010.010.020.000.00
Междомет.0.350.220.170.050.180.050.110.030.140.020.000.000.400.00
Часть комп.
сложн. слова
0.010.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.27.0419.8123.6226.5827.59
Глаг.9.4227.8426.5124.4422.75
Мест.-сущ.16.6611.259.669.128.45
Предл.9.036.9110.2310.3110.67
Союз13.736.016.637.508.76
Прилаг.3.433.954.725.555.83
Нареч.7.649.987.736.926.57
Местоим-прилаг.3.453.192.793.153.06
Частица5.347.515.564.374.21
Местоим. нареч.2.732.221.631.321.31
Числит.0.490.690.480.510.55
Числит-прилаг.0.150.410.280.160.16
Междомет.0.900.240.170.070.08
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
678910
Сущ.27.8627.8827.2727.5727.62
Глаг.21.6020.7720.6520.0119.71
Мест.-сущ.8.518.248.368.088.60
Предл.10.9411.1711.6211.5011.39
Союз9.389.399.269.499.47
Прилаг.6.226.196.436.486.29
Нареч.6.396.476.576.376.33
Местоим-прилаг.2.973.223.323.403.60
Частица3.964.304.254.614.61
Местоим. нареч.1.351.551.421.481.55
Числит.0.550.560.600.680.60
Числит-прилаг.0.150.160.190.200.15
Междомет.0.120.100.070.120.07
Часть комп.
сложн. слова
0.000.000.000.010.00

Номер слова в предложении
1112131415
Сущ.27.4627.0327.0327.0026.72
Глаг.19.8219.2219.8719.4719.19
Мест.-сущ.8.499.078.708.908.80
Предл.11.4011.8611.6611.5212.21
Союз9.419.188.979.309.23
Прилаг.6.566.796.896.906.73
Нареч.6.346.216.386.306.28
Местоим-прилаг.3.843.483.493.433.55
Частица4.374.714.624.724.84
Местоим. нареч.1.551.661.581.571.39
Числит.0.490.510.540.630.75
Числит-прилаг.0.130.180.170.170.21
Междомет.0.130.080.090.090.11
Часть комп.
сложн. слова
0.000.010.000.000.00