Лингвистический анализ: Русские и американцы. Про них и про нас, таких разных (Михаил Таратута)


- Русские и американцы. Про них и про нас, таких разных 1.09 Мб, 304с. скачать: (fb2) (исправленную)  читать: (полностью)  - Михаил Анатольевич Таратута

Общая статистика

Длина текста545548 знаков
Длина диалогов6209 знаков
Слов в произведении (СВП)78175 слов
Приблизительно страниц304 стр.
Средняя длина слова5.72 знаков
Предложений в произведении (ПВП)4722 предл.
Средняя длина предложения (СДП)112.59 знаков
Доля диалогов в тексте1.14 %
Доля авторского текста98.86 %
СДП диалогов81.80 знаков
СДП авторского текста121.76 знаков
Использование диалогов по тексту книги № 454664: Русские и американцы. Про них и про нас, таких разных (Михаил Таратута)
Максимальный фрагмент авторского текста - 283484 знаков (в страницах - примерно 157, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов19674
Активный словарный запас (АСЗ)19263
Активный не словарный запас (АНСЗ)411
Удельный АСЗ на 3000 слов текста1598.49123724 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста4231.34127207 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 454664: Русские и американцы. Про них и про нас, таких разных (Михаил Таратута)
Максимальный УАСЗ-3000 (1708) наблюдается примерно на 198 странице
Минимальный УАСЗ-3000 (1449) наблюдается примерно на 16 странице
Рост АСЗ книги № 454664: Русские и американцы. Про них и про нас, таких разных (Михаил Таратута)

Буквы и знаки препинания

Всего букв446478 букв
Всего знаков препинания15040 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 9165117.24
. 446857.15
- 6798.69
? 2182.79
! 781.00
... 00.00
!.. 00.00
?.. 10.01
!!! 00.00
?! 90.12
" 00.00
() 1171.50
: 2833.62
; 220.28
БукваКол-во (шт.)Частота использования (в %)
А343687.70
Б72271.62
В202194.53
Г69951.57
Д128422.88
Е-Ё382668.57
Ж69951.57
З68541.54
И-Й411859.22
К145063.25
Л182044.08
М151033.38
Н301216.75
О4892410.96
П115952.60
Р211934.75
С260015.82
Т293836.58
У103092.31
Ф8610.19
Х44661.00
Ц23450.53
Ч64691.45
Ш30000.67
Щ16050.36
Ь-Ъ82161.84
Ы87681.96
Э16870.38
Ю29890.67
Я81001.81
Диаграма использования букв книги № 454664: Русские и американцы. Про них и про нас, таких разных (Михаил Таратута)

Части речи

Определенных частей речи (ОЧР)77984 слов
Не определенных частей речи (НОЧР)191 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.2397130.738
Глаг.498413.889
Мест.-сущ.49846.391
Предл.765311.691
Союз73249
Прилаг.76539.814
Нареч.45325.811
Местоим-прилаг.45265.804
Частица35684.575
Местоим. нареч.9551.225
Числит.2800.359
Числит-прилаг.2070.265
Междомет.150.019
Часть комп.
сложн. слова
210.027

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.69.0047.3914.9651.6545.6626.5218.5216.5311.454.350.590.530.080.14
Глаг.33.3414.858.2129.3814.6213.528.357.966.181.600.470.360.030.03
Мест.-сущ.12.3117.492.694.496.944.686.262.005.960.910.140.040.000.00
Предл.57.831.4415.660.510.9920.130.8316.820.460.031.011.090.050.05
Союз19.7713.359.4810.405.738.779.766.138.351.770.260.140.000.01
Прилаг.71.323.601.824.197.016.071.331.171.060.290.150.050.030.03
Нареч.4.8217.043.466.505.876.515.422.584.311.180.320.080.000.01
Местоим-прилаг.28.795.194.443.001.906.992.331.822.600.490.180.290.010.00
Частица5.2215.722.045.362.683.504.032.543.091.240.260.080.000.00
Местоим. нареч.0.972.460.991.032.130.771.150.292.130.320.000.000.000.00
Числит.2.190.210.100.170.220.290.080.120.050.010.150.000.000.00
Числит-прилаг.1.670.090.040.190.130.310.030.050.060.040.050.000.000.00
Междомет.0.050.010.000.030.030.010.030.030.010.000.000.000.000.00
Часть комп.
сложн. слова
0.080.040.030.010.010.060.000.000.030.010.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.12.5123.6627.8628.4330.62
Глаг.6.6813.7216.1316.8316.23
Мест.-сущ.10.059.968.037.456.28
Предл.16.229.3210.7911.3611.02
Союз25.518.018.017.508.38
Прилаг.4.586.807.869.449.43
Нареч.8.878.426.745.705.68
Местоим-прилаг.6.477.035.536.406.44
Частица5.179.516.684.744.31
Местоим. нареч.3.272.521.641.291.03
Числит.0.230.560.340.520.18
Числит-прилаг.0.360.490.370.280.34
Междомет.0.060.000.000.000.02
Часть комп.
сложн. слова
0.000.000.020.040.04

Номер слова в предложении
678910
Сущ.31.0331.3531.1331.6130.82
Глаг.15.5215.0213.9114.6214.77
Мест.-сущ.5.875.015.735.005.63
Предл.11.5112.6011.6112.6812.98
Союз8.597.598.268.348.67
Прилаг.10.5910.9211.4111.2010.81
Нареч.5.526.205.515.374.90
Местоим-прилаг.5.435.605.865.525.66
Частица4.443.834.803.974.24
Местоим. нареч.0.851.050.780.791.03
Числит.0.230.380.680.550.28
Числит-прилаг.0.300.310.280.290.20
Междомет.0.070.020.030.000.03
Часть комп.
сложн. слова
0.050.100.030.050.00

Номер слова в предложении
1112131415
Сущ.29.9130.2530.3330.1231.47
Глаг.14.3614.2612.8612.4014.27
Мест.-сущ.5.385.915.776.425.43
Предл.12.9112.0413.1712.0211.89
Союз8.819.1810.259.269.05
Прилаг.11.4411.6910.9113.2711.23
Нареч.5.475.234.864.994.81
Местоим-прилаг.5.796.046.226.125.64
Частица4.113.983.894.124.65
Местоим. нареч.1.060.871.110.790.90
Числит.0.380.220.310.300.33
Числит-прилаг.0.380.290.240.150.16
Междомет.0.000.030.070.040.00
Часть комп.
сложн. слова
0.000.000.000.000.16