Лингвистический анализ: Статистический анализ взаимосвязи в Excel (Валентин Арьков)


- Статистический анализ взаимосвязи в Excel 10.17 Мб, 52с. скачать: (fb2) (исправленную)  читать: (полностью)  - Валентин Юльевич Арьков

Общая статистика

Длина текста92948 знаков
Длина диалогов1744 знаков
Слов в произведении (СВП)12462 слов
Приблизительно страниц52 стр.
Средняя длина слова6.04 знаков
Предложений в произведении (ПВП)1233 предл.
Средняя длина предложения (СДП)72.39 знаков
Доля диалогов в тексте1.88 %
Доля авторского текста98.12 %
СДП диалогов173.50 знаков
СДП авторского текста79.96 знаков
Использование диалогов по тексту книги № 462503: Статистический анализ взаимосвязи в Excel (Валентин Арьков)
Максимальный фрагмент авторского текста - 35065 знаков (в страницах - примерно 19, начинается где-то с 39 страницы)

Активный словарный запас

Использовано уникальных слов3372
Активный словарный запас (АСЗ)3057
Активный не словарный запас (АНСЗ)315
Удельный АСЗ на 3000 слов текста1269.77403729 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста2930.31350125 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 462503: Статистический анализ взаимосвязи в Excel (Валентин Арьков)
Максимальный УАСЗ-3000 (1421) наблюдается примерно на 46 странице
Минимальный УАСЗ-3000 (1125) наблюдается примерно на 21 странице
Рост АСЗ книги № 462503: Статистический анализ взаимосвязи в Excel (Валентин Арьков)

Буквы и знаки препинания

Всего букв71291 букв
Всего знаков препинания2241 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, 58546.94
. 1295103.92
- 604.81
? 80.64
! 20.16
... 00.00
!.. 00.00
?.. 00.00
!!! 00.00
?! 00.00
" 00.00
() 745.94
: 15612.52
; 614.89
БукваКол-во (шт.)Частота использования (в %)
А63568.92
Б10791.51
В30294.25
Г10611.49
Д21783.06
Е-Ё61028.56
Ж10611.49
З14001.96
И-Й68719.64
К23793.34
Л24953.50
М29004.07
Н51067.16
О63498.91
П17462.45
Р41015.75
С37175.21
Т41975.89
У17212.41
Ф5760.81
Х5490.77
Ц5140.72
Ч10851.52
Ш2600.36
Щ1880.26
Ь-Ъ9761.37
Ы16802.36
Э3060.43
Ю4000.56
Я14902.09
Диаграма использования букв книги № 462503: Статистический анализ взаимосвязи в Excel (Валентин Арьков)

Части речи

Определенных частей речи (ОЧР)11541 слов
Не определенных частей речи (НОЧР)921 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Сущ.499443.272
Глаг.41014.037
Мест.-сущ.4103.553
Предл.116311.810
Союз7276
Прилаг.116310.077
Нареч.4503.899
Местоим-прилаг.3743.241
Частица1701.473
Местоим. нареч.860.745
Числит.920.797
Числит-прилаг.890.771
Междомет.20.017
Часть комп.
сложн. слова
10.009

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

Сущ.Глаг.Мест.-сущ.Предл.СоюзПрилаг.Нареч.Местоим-прилаг.ЧастицаМестоим. нареч.Числит.Числит-прилаг.Междомет.Часть комп.
сложн. слова
Сущ.166.2865.8515.2572.3540.4632.6717.248.755.113.991.822.690.090.09
Глаг.54.5011.444.0723.918.1418.205.556.673.210.952.860.870.000.00
Мест.-сущ.7.4513.081.132.171.473.473.470.611.730.260.350.260.090.00
Предл.65.943.126.932.511.2122.700.4310.830.000.001.562.860.000.00
Союз16.9814.993.387.972.606.243.812.772.170.870.350.870.000.00
Прилаг.78.764.071.043.643.997.621.130.260.000.260.000.000.000.00
Нареч.4.1616.811.913.211.913.994.331.040.610.690.350.000.000.00
Местоим-прилаг.20.882.690.950.521.043.550.870.350.780.170.610.000.000.00
Частица3.035.460.261.560.780.691.210.950.350.260.090.090.000.00
Местоим. нареч.0.952.770.520.170.950.430.780.090.780.000.000.000.000.00
Числит.6.670.000.000.000.090.950.090.090.000.000.000.090.000.00
Числит-прилаг.7.020.090.000.090.350.170.000.000.000.000.000.000.000.00
Междомет.0.000.000.090.000.000.000.090.000.000.000.000.000.000.00
Часть комп.
сложн. слова
0.090.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Сущ.26.6846.4442.9536.0039.05
Глаг.22.6613.3017.4316.4915.24
Мест.-сущ.5.995.063.413.863.73
Предл.17.418.8412.3113.1012.01
Союз6.904.465.575.665.85
Прилаг.5.919.798.7212.3512.51
Нареч.6.653.004.495.663.63
Местоим-прилаг.2.055.412.253.963.43
Частица1.151.631.171.231.92
Местоим. нареч.3.200.340.540.470.61
Числит.0.330.430.540.571.61
Числит-прилаг.1.071.290.540.660.40
Междомет.0.000.000.000.000.00
Часть комп.
сложн. слова
0.000.000.090.000.00

Номер слова в предложении
678910
Сущ.38.6341.2638.0639.4441.14
Глаг.13.1311.2816.2513.0911.02
Мест.-сущ.3.643.102.502.624.13
Предл.13.5812.0213.4712.7712.01
Союз7.066.948.069.008.27
Прилаг.11.9211.1510.5611.2910.43
Нареч.4.084.964.583.272.36
Местоим-прилаг.3.423.592.924.585.31
Частица1.552.231.252.131.57
Местоим. нареч.0.441.120.690.160.39
Числит.1.661.491.251.311.77
Числит-прилаг.0.880.740.420.331.57
Междомет.0.000.120.000.000.00
Часть комп.
сложн. слова
0.000.000.000.000.00

Номер слова в предложении
1112131415
Сущ.35.3944.0543.1345.8338.17
Глаг.11.409.739.908.759.14
Мест.-сущ.3.332.702.240.834.84
Предл.16.3913.7811.5012.9213.44
Союз9.506.497.357.508.06
Прилаг.12.8310.0017.2513.7513.98
Нареч.3.092.161.282.922.15
Местоим-прилаг.3.804.052.242.925.38
Частица1.433.242.241.672.15
Местоим. нареч.0.240.540.001.250.00
Числит.1.191.351.280.830.54
Числит-прилаг.1.431.891.600.831.61
Междомет.0.000.000.000.000.54
Часть комп.
сложн. слова
0.000.000.000.000.00